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GLUTAMINE:FRUCTOSE-6-PHOSPHATE AMIDOTRANSFERASE (GFAT) 
COMPRENANT UNE ETIQUETTE DE PURIFICATION INTERNE, ET SON 
UTILISATION POUR LE CRIBLAGE DE COMPOSES 



10 



La pr6sente invention conceme une glutamine:fractose-6-phosphate 
amidotransf6rase modifiee, purifiable rapidement et en quantity suffisantes pour le 
criblage de composes modifiant son activity. 

Les gIutamine:fi:uctose-6-phosphate amidotransf^rases (GFAT), EC 2.6.1.16, 
6galement appel6es gl\icosamlne-6-phosphate synthases ou 2-d6oxy-glucose-6- 
phosphate cdtol isom6rases, sont inapUqu6es dans la voie de biosynthdse des 
hexosamines. La GFAT catalyse la premiere 6tape, limitante, de cette voie de 
biosynth^se selon la r6action : 

I^Glutamine + fructose-6-pliosphate ► L-Glutamate + glucosamine-6-phosphate 

par transfert de I'azote amidique de la L-Glutamine sur la fonction c6tone du fructose-6- 
15 phosphate. Les GFAT controlent done le flux de glucose dans la voie des hexosamines, 

via le fructose-6-phosphate, et par consequent la formation des hexosamines produites. 

Une forme bact^rienne recombinante de la GFAT. la glucosamine-6-phosphate 
synthase d'Escherichia coH, a 6t6 puiifi6e k homog6n6it6 et 6tudi6e de fe^on 
exhaustive. Les propii6t6s et le m6camsme enzymatique du transfert de I'amide ont 
20 notamment 6t6 largement d6crits (pour revue Teplyakov et al., Nat. Prod. Rep. (2002) 

19:60). En paxticuUer, cette enzyme, dont la structure cristalline a 6t6 r6solue 
(Teplyakov et al, J. Mol. Biol. (2001) 313:1093), est form6e de deux domaines, I'un 
ayant une activit6 hydrolase (glutaminase) et I'autre une activity isom6rase. 

Par ailleurs, des GFAT d'eucaryotes ont 6t6 caract6ris6ei. dont notamment celle 
de foie de rat (Huynh et al. Arch. Biochem. Biophys. (2000) 379:307) et celle de la 
levure Candida albicans (Milewsky et al, J. Biol Chem. (1999) 274:4000). 

Chez I'homme, des etudes preliminaires ont montr6 la presence d'une activity 
GFAT dans le foie (Ghosh et al, J. Biol Chem. (1960) 235:1265). Plusieurs GFAT sont 
d6sormais connues. GFATl, la forme principals GFAT2, qui est exprim6e 
prdferentiellement dans le systSme nerveux central, et GFATlAlt, une isofoime de 
GFATl, exprim^e essentiellement dans les muscles strife. Les sequences peptidiques de 
GFATl et GFAT2 possMent 75% d*identit6s de sequences entre elles, et celles de 
GFATl et GFATlAlt sont identiques excepte pour une insertion de 18 acides amines 
dans la s6quence de GFATlAlt. Les sequences de GFAT sont done trfe conserv6es chez 
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rhomme, mais 6galement entre les esptees, puisque les s6quences peptidiques de la 
GFATl humaine et de la GFAT d'E. coli ou de la GFATl de souris pr&enteat 
respectivement 35% et 99% d'identit6s. 

Le gdne de la GFATl humaine a 6t6 clon6 en 1992 (McKnight et al., J. Biol 
Chem. (1992) 267:25208). U code une prot^ine de 77 kDa formee de deux domaines 
distincts (Teplyakov et al, Nat. Prod. Rep. (2002) 19:60). 

L' augmentation de la production de I'UDP-NAc-GlcNHz, le produit final de la 
voie de biosynthese des hexosamines, et son accumulation dans les tissus ont 
r6cemment 6t6 impUqu^es dans le developpement de la r6sistance k I'insuline (Marshall 
et al, FASEB J. (1991) 5:3031. YM-Jarvinen et al. Diabetes (1996) 45:302, Thompson . 
et al, J. Biol Chem. (1997) 272: 7759. Hawkins et al, J. Clin. Invest. (1997) 99:2173. 
Robinson et al. Diabetes (1993) 42: 1333. Daniels et al, J. Clin. Invest. (1995) 96:1235*. 
Baron et al, J. Clin. Invest. (1995) 96:2792). 

Ainsi, il a 6t6 montr6 qu'une augmentation du niveau cellulaire d'UDP-NAc- 
GICNH2 par une modeste surexpression de GFATl, ou un apport de glucosamine 
exog^aie, peut induire une r6sistance a I'insuline k la fois in vivo et dans des adipocytes 
en culture (Robinson et al. Diabetes (1993) 42:1333, Daniels et al, J. Clin. Invest. 
(1995) 96:1235, Baron et al, J. Clin. Invest. (1995) 96:2792, Hebert et al., J. Clin. 
Invest. (1996) 98:930). 

En effet, I'insuline active sa voie de transduction en se fixant k son recepteur, ce 
qui induit la translocation des transporteurs de glucose, tels que le recepteur GLUT4, 
stock6s dans la cellule, vers la membrane, et augmente I'afflux de glucose. Le glucose 
entre ainsi dans la voie de la glycolyse et est convert! en glucose-6:phosphate puis «i 
fructose-6-phosphate. Lorsque I'afflux de glucose est excessif, le fructose.6-phosphate 
entre dans la voie de biosynthtee des hexosamines et est converti en glucosamine-6- 
phosphate par la GFAT. Plusieurs observations mdiquent que les metabolites de la 
glucosamine.6-phosphate empSchent la translocation des recepteurs au glucose vers la 
membrane cellulaire. diminuant ainsi I'afflux du glucose cellulaire (Marshall et al, 
FASEB J. (1991) 5:3031, Giacarri et al, Diabetologia (1995) 38:518, Marshall et al, J. 
Biol Chem. (1991) 266:4706, Paterson et al. Endocrinology (1995) 136:2809). 

Le m^canisme par lequel les metaboUtes de la glucosamine.6-phosphate exercent 
leurs effets physiologiques n'est pas clair. Une hypothtee a cependant 6t6 piopos6e : 
une concentration cytosoUque 61ev6e d'UDP-NAc-GlcNH^ entratoerait 
I'hyperglycosylation des sites de phosphorylation Ser ou Thr. conduisant de la sorte h 
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rairSt de la voie de signalisation de rinsuline (Comer et al, J. Biol Chem. (2000) 
275:29179). 

L'activit6 GFAT est done consid6r6e comme 6tant Tune des causes des hauts 
niveaux de glucose sanguin ; par ailleurs elle est coirnue pour 6tre elev6e chez les 
patients atteints de diabete sucr6 non-insulino dependant ou diabdte de type II (Yki- 
Jarvinen et al. Diabetes (1996) 45:302). 

L'obtention d'inhibiteurs de la GFAT permettrait d'abaisser la glycemie en 
particulier chez les individus atteints de pathologies liees k une hyperglyc6mie, telles 
que le diabete de type n, 1' acidose et/ou la c6tose diab6tique, par exemple. 

Des inhibiteurs de la GFAT de plante ou de champignon pourraient 6galement 
permettre d*obtenir respectivement des fongicides et des herbicides. 

Toutefois, malgre Tobtention de formes recombinantes de GFAT, Finstabilit^ des 
preparations enzymatiques obtenues, lein: faible quantit6, et leur niveau de purification 
insuffisant, n'ont pas permis d'obtenir des inhibiteurs efficaces de GFAT. 

Un objet de I'invention est done de foumir une GFAT modifi6e dont T activity est 
stable et pouvant etre obtenue en grande quantit6, avec un haut niveau de purete et 
d'activite. 

La pr6sente invention conceme une prot6ine enzymatiquement active 
comprenant : 

- une sequence de GFAT et au moins une sequence d'une etiquette de 
purification, la sequence de r6tiquette de purification 6tant ins6r6e entre deux 
acide aniin6s consecutife de la s6quence de GFAT, ou 

- une s6quence d6rivant de la s6quence pr6c6dente par suppression, insertion ou 
mutation d'au moms un acide auiin6, sous r6serve queUadite prot6ine pr6sente 
une activity enzymatique, ou 

- une s6quence pr6sentant au moins 35 %, notamment au moins 90 %, d'identite 
de sequence et/ou au moins 44 %, notamment au moins 95 %, de similarite de 
sequence avec Tune des sequences prec6dentes, sous reserve que ladite proteine 
pr6sente une activity enzymatique. 

On designe par GFAT une enzyme de la classe E.G. 2.6.1.16 catalysant la r6action 
suivante : 

L-Glutamine + fiiictose-6-phosphate ► L-Glutamate + glucosamine-6-phosphate 

notamment dans les conditions exp6rimentales telles qu'elles sont d6crites dans 
Texemple qui suit ou dans Broschat et al, J. Biol Chem, (2002) 277:14764. 
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GFAT est d6sigii6e sous le nom de glutamine:jBiictose-6-phosphate 
amidotransf&ase, ou 6galement glucosamine-6-phosphate synthase ou 2-d6oxy-glucose- 
6-phosphate c^l isom^rase. 

On d&igne par «prot6ine enzymatiquement active » une prot6ine ayant une 
5 action catalytique. 

Avantageusement, la prot6ine enzymatiquement active possMe une activity 
GFAT. 

On d6sigae par « 6tiquette de purification » une s6quence peptidique susceptible 
de se Uer sp6cifiquement k un Ugand donn6. Avantageusement, la Uaison dudit Ugand k 
10 l'6tiquette de purification permet de former un complexe entre la piot6ine portant 

l'6tiquette de purification et ledit Ugand, ledit complexe pouvant Stre sp6cifiquement 
isol6. 

Avantageusement, les 6tiquettes de purification selon I'invention ne sont pas 
plactes en bout de chaine peptidique, a I'extr6mit6 N-terminale ou C-tenninale, mais k 
1 5 I'int&ieur de la chaine peptidique. 

On d6signe par « identite de sequence » le pourcentage d'acides amines identiques 
entre deux sequences aUgnees, notamment k I'aide d'algorithmes tels que celui d6fini 
par Altschul et al. Nucleic Acids Res. (1997) 25:3389, par exemple. 

On d^signe par « similarity de s6quence » le pourcentage d'acides amines 
similaires. c'est-a-dire d'acides amin6s dont les chalnes lat6rales possfedent des 
propri6tes physico-chimiques proches, entre deux sequence align^es, notamment k 
I'aide d'algorithmes tels que celui d6fini par Altschul et al.. Nucleic Acids Res. (1997) 
25:3389, par exemple. 

La pr6sente invention conceme en particulier une prot6iiie telle que d6finie ci- 
dessus, dans laquelle la sequence de GFAT correspond k une s6quence de GFAT de 
bact&ie ou d'eucaryote. notamment de plante, de champignon ou d'animal. en 
particulier d'insecte ou de mammifere, plus particulierement d'homme. 

L'invention conceme plus particulierement une prot6ine telle que d6finie ci- 
dessus. dans laquelle la s6quence de I'etiquette de purification est ins6r6e entre deux 
acides amines cons^cutifs de la sequence de GFAT, lesdits acides amin6s 6tant compris 
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- une partie de la s6quence de la GFAT correspondant et/ou 6tant homologue k la 
sequence s'6tendant entre le feuillet p2 et le feuiUet /33 de la GFAT d'Escherichia 
coliy ou 
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- partie de la s6quence de la GFAT correspondant et/ou 6tant homologue k la 
sequence s'6tendant entre le feuillet /S13 et le feuillet /314 de la GFAT 

Escherichia coli, ou 

- une partie de la sequence de la GFAT correspondant et/ou 6tant homologue k la 
s^uence s'6tendant entre le feuillet j815 et I'hdUce 06 de la GFAT d'Escherichia 
coli. 

La structure de la GFAT ^'Escherichia coli est d6ciite en particuUer par 
Teplyakov et al., J. Mol Biol (2001) 313:1093 Cprot6ine entiere), par Isupov et al. 
Structure (1996) 4:801 (domaine glutaminase) et par Teplyakov et al. Structure (1998) 
6:1047 (domaine isom6rase). La structure de la protftne complete est notamment 
consultable k I'aide du fichier de coordonn6es atomiques IJXA d6pos6 aupr^s de la 
Protein Data Bank (http://www.pdb,org). 

La s&tuence peptidique de la GFAT A'E. coli est ddfinie par SEQ ID NO : 13. 

La s6quence s'6tendant entre le feuillet /32 et le feuillet /33 correspond k la 
sequence s'6tendant approximativement entre les acides aminfe 30 k 80 de la GFAT 
d'£. coli, situ6s dans le domaine glutaminase. 

La sequence s'etendant entre le feuiUet /513 et le feuillet jSU correspond k la 
sequence s'etendant approximativement entre les acides amines 220 k 230 de la GFAT 
d'^, coli, situ6s dans le domaine glutaminase. 

La s6quence s'6tendant entre le feuillet j815 et l'h6Uce q6 correspond k la 
s6quence s*6tendant approximativement entre les acides amines 235 k 250 de la GFAT 
d'£^. coli, situ6s dans le domaine isom^rase. 

Selon un mode de realisation particulier, I'invention conceme done une protdine 
teUe que d6finie ci-dessus, dans laquelle la sequence de T^tiqiiette de purification est 
ms6r6e entre deux acides aminfe cons6cutife de la s6quence de GFAT, lesdits acides 
amines 6tant compris dans : 

- une partie de la s6quence de la GFAT correspondant et/ou 6tant homologue k la 
sequence s'6tendant approximativement entre les acides amines 30 k 80 de la 
GFAT 6.' Escherichia coli, ou 

- une partie de la sequence de la GFAT correspondant et/ou etant homologue k la 
sequence s'etendant approximativement entre les acides amin6s 220 k 230 de la 
GFAT Escherichia coli, ou 
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- une partie de la sequence de la GFAT correspondant et/ou 6tant homologue k la 
sequence s'6tendaiit approximativement entre les acides amines 235 k 250 de la 
GFAT 6^ Escherichia colL 

L'identification des parties de sequences d'une GFAT coirespondant et/ou 6tant 
homologue k des structures secondaires de la GFAT d'^. coli peut Stre obtenue en 
aHgoant la sequence de ladite GFAT avec celle de la GFAT d'£. coli, notamment i 
I'aide d'un algorithme tel que celui d^fini par Altschul et al. Nucleic Acids Res. (1997) 
25:3389 ou k I'aide du logiciel Clustal W, bien connu de I'homme de I'art et d^crit par 
Thompson et al., Nucleic Acids Res. (1994) 22: 4673-4680, par exemple. 

En particulier, deux s6quences ou parties de sequences sont dites homologues si le 
pourcentage d'identit6 entre ces deux sequences ou parties de sequences est sup6rieur k 
environ 35% et/ou si le pourcentage de similarity entre ces deux sequences ou parties de 
s^umces est sup6rieur k environ 44%. 

Plus particuUerement, deux sequences ou parties de s6quences sont dites 
homologues si elles sont susceptibles de s'hybrider dans des conditions stringentes, 
telles que les conditions suivantes : fonnamide 50%, NaCl 0,75 mol/1. citrate de sodium 
0,75 mmol/1, sodium dod^cyl sulfate 1%, pH 7, 42**C. 

Selon un autre mode de r6aHsation pref6r6. I'invention conceme une prot6ine 
telle que d6finie ci-dessus, dans laquelle la sequence de I'^tiquette de purification est 
ins6ree entre deux acides amines cons6cutife de la s6quence d'une GFAT humaine, 
lesdits acides amines 6tant compris entre les acides amin6s 40 k 50, 290 k 330, et/ou 340 
k 370 de ladite s6quence de GFAT humaine. 

Les acides amin6s 40 k 50 de ladite sequence de GFAT humaine correspondent 
et/ou sont homologues k la partie de la sequence de la GFAT d'fe coli s'6tendant entre 
le feuillet ^2 et le feuiUet ^3, c'est-^-dire a la s6quence s'6tendaut approximativement 
entre les acides amines 30 i 80 de la GFAT d'E. coli. 

Les acides amines 290 k 330 de ladite sequence de GFAT humaine correspondent 
et/ou sont homologues k la partie de la sequence de la GFAT d'E. coli s'dtendant entre 
le feuillet ^13 et le feuillet ^14, c'est-^i-dire k la sequence s'6tendant approximativement 
30 entre les acides amui6s 220 k 230 de la GFAT d' E. coli. 

Les acides amines 340 a 370 de ladite sequence de GFAT humaine correspondent 
et/ou sont homologues k la partie de la sequence de la GFAT d'E. coli s'6tendant entre 
le feuillet /S15 et l'h6Uce a6, c'est-i-dire k la sequence s'6tendant approximativement 
«itre les acides amin6s 235 k 250 de la GFAT d'^. coli. 
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L'invention conceme notamment une piot6ine ci-dessus, dans laquelle la 
sequence de GFAT coirespond k : 

- SEQ ID NO : 2, coirespondant k la sequence de la GFATl humaine, 

- SEQ ID NO : 4, correspondant k la sequence de la GFAT2 humaine, 

- SEQ ID NO : 6, correspondant k la s6quence de la GFATlAlt humaine. 

La sequence de la GFATl humaine est notamment d6crite dans McKnight et al., 
J. Biol Chem. (1992) 267:25208, et coirespond k la sequence nucl6otidique SEQ ID 
NO: 1. 

La sequence de la GFAT2 humaine est notamment d6crite dans Old et al. 
Genomics (1999) 57:227, et coirespond k la sequence nucl6otidique SEQ ID NO : 3. 

La sequence de la GFATlAlt humaine est notamment d6crite dans DeHaven et 
al. Diabetes (2001) 50:2419, et correspond k la sequence nucl6otidique SEQ ID NO : 5. 

L'invention conceme en particulier une prot6ine d-dessus, dans laquelle la 
sequence de I'dtiquette de purification est ins6r6e entre deux acides amines cons6cutifs, 
lesdits acides amines 6tant compris entre les acides amines : 

- 43 k Al, 298 k 306, et/ou 342 k 347 de SEQ ID NO : 2, 

- 42 k 45, 299 a 307, et/ou 343 k 348 de SEQ ID NO : 4 

- 43 k 47, 316 324, et/ou 360 k 365 de SEQ ID NO : 6 

Les acides amines 43 k 47 de SEQ ID NO : 2, 42 ^ 45 de SEQ ID NO : 4 et 43 i 
47 de SEQ ID NO : 6 correspondent, k savoir sont homologues, k la partie de la 
sequence de la GFAT d'E. coli s'6tendant entre le feuillet /32 et le feuillet i83, c'est-i- 
dire i la sequence s'dtendant ^proximativement entre les acides amines 30 ^ 80 de la 
GFATd'E. CO//. 

Les acides amin6s 298 k 306 de SEQ ID NO : 2, 299 k 307 de SEQ ID NO : 4 et 
325 k 330 de SEQ ID NO : 6 correspondent, k savoir sont homologues, k la partie de la 
sequence de la GFAT d'5. coli s'^tendant entre le feuillet |813 et le feuillet j814, c'est-^- 
dire k la s6quence s'6tendant approximativement entre les acides amines 220 k 230 de la 
GFAT d'£. coli. 

Les acides amin6s 342 k 347 de SEQ ID NO : 2, 343 k 348 de SEQ ID NO : 4 et 
360 i 365 de SEQ ID NO : 6 correspondent, k savoir sont homologues, k la partie de la 
sequence de la GFAT d'£. coli s'6tendant entre le feuiUet jSlS et rh6Hce a6, c'est-^-dire 
k la sequence s'6tendant approximativement entre les acides amines 235 k 250 de la 
GFAT d'5. coli. 
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Selon un autre mode de realisation partictiUer, rinvention conceme plus 
particuUferemesnt une prot^ine telle que ddjBnie ci-dessus, dans laquelle la sequence de 
l'6tiquette de purification est ins6r6e entre deux acides amines cons6cutifs de la 
sequence de GFAT, lesdits acides amines 6tant compris dans : 
5 - une partie de la sequence de la GFAT correspondant et/ou 6tant homologue k la 

sequence s'6tendant approximativement entre les acides amines 43 47 de la GFATl 
humaine, 

- une partie de la s6quence de la GFAT correspondant et/ou 6tant homologue k la 
sequence s'dtendant approximativement entre les acides amin6s 298 k 306, notamment 

10 299 k 300, de la GFATl humaine, 

- une partie de la sequence de la GFAT correspondant et/ou etant homologue k la 
sequence s'6tendant approximativement entre les acides amin6s 342 k 347 de la GFATl 
humaine. 

L'invention conceme plus particuli^ement une prot6ine ci-dessus, dans laquelle 
15 la sequence de r6tiquette de purification est inseree entre les acides amin6s : 

- 299 et 300 de SEQ m NO : 2, 

- 300 et 301 de SEQ O NO : 4, 

- 317 et 318 de SEQ ID NO : 6. 

L'invention conceme notamment une prot6ine ci-dessus, dans laquelle 1' etiquette 
20 de purification correspond k une s6quence d'environ 2 k environ 10 acides amin6s, 

notamment d'environ 4 k environ 8 acides amin6s. 

Des etiquettes de purification preferees selon l'invention concement notamment 
des etiquettes dites FLAG (Sigma-Aldrich, France). Ces etiquettes se Uent 
specifiquement k un paratope donn6, ledit paratope pouvant appartenir k un anticorps ou 
k un fiagment d'anticorps par exemple. Un exemple particuUer d'etiquette FLAG est 
constitue par la sequence peptidique Asp-Tyr-Lys-Asp-Asp-Asp-Asp-Asp-Lys (SEQ ID 
NO : 18) par exemple. 

D'autres etiquettes preferees selon l'invention sont des etiquettes formees de 
plusieurs histidiaes. Ces etiquettes peuvent former des complexes avec des cations 
30 metalliques divalents tels que Ni^* ou Co^"^ par exemple. 

L'invention conceme en particuUer une proteine teUe que definie ci-dessus, dans 
laquelle I'etiquette de purification est une hexa-histidine. 

On designe par hexa-histdine la sequence His-His-His-His-His-His (SEQ ID NO : 

19). 
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L'invention conceme plus particuliferement une prot6ine telle que d6fime ci- 
dessus correspondaut aux s6queiices : 

- SEQ ID NO : 8, correspondant k la sequence SEQ ID NO : 2 dans laquelle une 
hexa-histidine est inser6e entre les acides ainm6s 299 et 300, 

- SEQ ID NO : 10, correspondant k la sequence SEQ ID NO : 4 dans laquelle une 
hexa-histidine est ins6ree entre les acides aminds 300 et 301, et 

- SEQ ID NO : 12, correspondant la sequence SEQ ID NO : 6 dans laquelle une 
hexa-histidine estins6ree entre les acides amin6s 317 et 318. 

La pr6sente invention conceme egalement un acide nucl6ique comprenant ou Stant 
constitu6 d'une s6quence codant pour une prot6me telle que d6finie ci-dessus. 

L'invention conceme plus particuliferement un acide nucl6ique comprenant ou 
6tant constitu6 de la sequence nucl6otidique : 

- SEQ ID NO : 7 codant pour la prot6ine SEQ ID NO : 8, ou 

- SEQ ID NO : 9 codant pour la proteine SEQ ID NO : 10, ou 

- SEQ ID NO : 1 1 codant pour la proteine SEQ ID NO : 12, 

ou de son complementaire, ou 6tant d6rive de ladite s6quence par mutation, insertion ou 
deletion d'au moins un nucleotide, sous r6serve que ladite sequence nucleotidique code 
pour une prot6ine enzymatiquement active. 

Selon un autre mode de realisation, la pr6sente invention conceme 6galement un 
vecteur eucaryote ou procaryote comprenant xm acide nucl6ique tel que d6fini ci-dessus. 

Ces vecteurs pennettent notamment de syntii6tiser les prot6ines selon rinvention 
dans un organisme eucaryote ou procaryote. 

Avantageusement I'invention conceme un vecteur d'expression de type 
baculovirus permettant la synthtee des prot6ines selon Tinv^tion dans des cellules 
d'insecte. 

La presente invoation conceme egalement xm proced6 de purification d'une 
prot6ine telle que d6finie ci-dessxis, k partir d'une solution comprenant ladite prot6ine, 
comprenant une 6tape de mise en presence de ladite solution avec im compos6 se liant 
specifiquement k Tetiquette de purification de ladite proteine et une etape de separation 
du complexe form6 par la liaison de ladite proteine audit compos6 des autres 
constituants de la solution. 

Le compos6 pent Stre fix6 stjt un support solide de sorte que le complexe form6 
entre ledit compos6 et ladite proteine pent Stre r6cup6r6 par centrifiigation ou filtration. 
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Optionnellemeait ledit compos6 fix6 sur son support peut 6tre dispose dans une colonne 
k travers laquelle ladite solution est 61u6e. 

Avantageusement, le proc6d6 ci-dessus peut 6galenient comprendre une 6tape de 
dissociation du complexe fonn^ par la liaison de ladite prot^ine audit compos6 afin de 
5 recuperer la proteine purifi6e. 

L'invention conceme plus particuliferement un proc6d6 de purification tel que 
defini ci-dessus, comprenant une etape de mise en pr6sence d'une solution comprenant 
une prot6ine telle que d6finie ci-dessus avec un compost comprenant un cation 
m6talUque divalent tel que Ni^* ou Co^*, notamment Ni^* et une 6tape de separation du 
1 0 complexe form6 par la Uaison de la prot6ine audit compost des autres constituants de la • 

solution. 

Avantageusement, le proc6d6 ci-dessus peut 6galement comprendre une 6tape de 
dissociation du complexe foTm6 par la Uaison de ladite prot6ine audit compos6 
comprenant un cation m6talUque divalent, notamment a I'aide d'imidazole, afin de 
1 5 r6cup6rer la prot6ine purifi6e. 

Selon un autre mode de realisation la pr6sente invention conceme un proc6d6 de 
conservation d'une proteine telle que d^finie ci-dessus sous une fonne 
enzymatiquement active, notamment k -80°C ou k 4°C, comprenant I'adjonction de 
ladite proteine k une solution compr^ant : 

- d'environ 1 mM k environ 10 mM de fiructose 6-phosphate, notamment environ 
1 mM, 

- d'environ 1 mM k environ 5 mM de Tris(2-carboxyethyl)phosphine, 
notamment environ 1 mM, 

- d'environ 5 % k environ 20 % de glycol, notamment Environ 10%. 
fiiictose-6-phosphate est un substrat de ladite prot6ine. 

Le Tris(2-carboxyethyl)pliosphine est un compos6 r6ducteur permettant 
avantageusement de maintenir les propriete de resines portant des ions Ni^"^ ou Co^*. 
Avantageusement le glycerol est un agent cryoprotectant. 

A ce titre la presente invention conceme 6galement une composition comprenant 
30 une prot6ine GFAT active, le cas 6ch6ant U6e k une Etiquette de purification, telle 

qu'une prot6ine telle que definie ci-dessus, ladite proteine 6tant susceptible de pouvoir 
Stre conserv6e sous une forme enzymatiquement active, durant au moins 8 jours k une 
temp6rature de 2°C k 10°C, notamment environ 4'C, et durant au moins 12 mois k une 
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temp6rature de -100°C k -ZO'C, notamment environ -80*C, ladite prot^ine 6tant en 
association avec : 

- environ 1 mM k environ 10 mM de fructose 6-pliosphate, notamment environ 1 
mM, 

5 - environ 1 mM k environ 5 mM de Tris(2-carboxyethyl)phosphine, notamment 

environ 1 mM, 

- environ 5 % a environ 20 % de glycerol, notamment environ 10%, 

La presente invention conceme 6galement I'utilisation d'une prot6ine telle que 
d^finie ci-dessus, pour le criblage de composes modifiant l'activit6 de ladite piot6ine, 
10 en particulia: pour le criblage d'inhibiteur de ladite prot6ine. 

L'activit6 des prot6ines selon Tinvraition pent @tre en particulier mesur6e k I'aide 
des m^thodes suivantes : 

- la m6thode radiom6trique d6crite par Broschat et aL, Analytical Biochem. (2002) 
305:10-15, 

15 - la mdtiiode dite au Nitrb Bleu T6trazolium d6crite par Nakata et al., J. Antibio. 

(2001) 54:737-743. 

- la m6thode Morgan-Elson d6crite par Ghosh et aL, Method. Enzymol (1960) 
5:414 et dStaill6e dans Texemple qui suit. 

- la methode APAD d^crite par Badet et al. Biochemistry (1987) 26:1940 et 
20 ddtaillee dans I'exemple qui suit. 

Avantageusement ces m6thodes peuvent dtre utilis6es pour le criblage, notamment 
k haut d6bit, de compos6s modifiant Tactivit^ des prot6ines selon I'invention. 

L'invention conceme en particulier I'utilisation telle que d6finie ci-dessus, pour le 
criblage de composes utiles dans le cadre du traitement ou de 1^ prevention du diabfete, . 
25 notamment du diab^e de type U, de l'ob6sit6, de Tacidose, de la c6tose, de I'arthrite, 

des cancers, ou de TostSoporose. 
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DESCRIFnON DE LA FIGURE 1 

La Figure 1 rejar&ente le plasmide pFastBac-gfat-His6 de poids mol6culaire 6,89 
kb. La cassette «Ampr» repr6sente un gfene de r6sistance k I'ampicilline, la cassette 
« ori » repr6sente une origine de replication bact6rieme, la cassette « Gmr » repr6sente 
un ghne de r6sistance k la gentamicine, la cassette « Polh Pr » reprdsente le promoteur 
de la polyh6drine, la cassette gfat-his6 repr^sente le gdne gfatl niodifi6 par I'insertion 
d'une s6quence codant pour une 6tiquette hexahistidine. Les sites de restriction JK&al en 
position 4,1 1 kb, et EcoRl en positions 4,56 kb et 6,60 kb sent 6galement repi^entfe. 



} 
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1. Synthase et clon aee du gfene 0bitl-His6 

Le fragment EcoBl d»un ADNc coirespondant au g6ne gfatl humain a 6t6 cloii6 
dans le site EcoS. I du vectera: pCRH (Invitrogen) pour fonner le plasmide pCRH-gfatl. 
La sequence nucl6otidique d'uue Etiquette de purification interne compos6e de 6 r^sidus 
histidine a 6t6 introduite en position 898 de la sequence du g^ne gfatl clon6 dans pCRH 
par PGR avec la Platinum pfx polymerase (Roche) et la paire d'amoices q)propri6es : 
- Start Aatn-His6 : 

5'TGGACGTCTTTCTATCCATCGAATTAAACGAACTGCAGGACATCACC 
ATCACCATCACGATCACCCCGGACG 3* (SEQ ID KO : 14) 

-EndHincE: 

5' CAAAGTTGACTCTTCCTCTCATTGTGTTCACGACAGACTCTGGC 3' 
15 (SEQ ID NO: 15) 

selon le protocole suivant : 94°C, 2min puis 30 cycles (94°C 45 sec, 55°C 1 min, 72°C 
5 min) suivis d'une polymerisation de 5 min a 72°C et retour a 4°C. 

Aprfes digestion par AatJS. et HincIL puis purification sur gel d'agarose Seaplaque 
1,5% (Tebu), I'ampUcon (170 bp) a 6t6 ins6r6 au niveau des sites de restriction 
20 correspondants dans la construction pCRD-gfatl. L'insert de 170 pb a 6t6 introduit par 

ligation dans la construction avec un r^ort 3:1 k 16-0 pendant la nuit en presence de 
T4 DNA Ugase (Nebs). Le m61ange de Ugation (20 ^l) ainsi obtenu a permis de 
transformer une souche d'5. coli JM109. Ensuite, le fragment A&al- Htndni du plasmide 
recombinant pCRH-gfatl-HisS a 6t6 clon^ dans le plasmide domeur pFastBacl (Life 
Technologies Ltd). Le plasmide pFastBac-gfat-His6 ainsi g6n6r6 (Fienre 1^ a 6t6 v6rifi6 
par digestions multiples: Smal, AccilDral, PstBVXbal, et par sdquengage. En vue 
d'am6Uorer la construction, la s6quence en amont du codon de d6marrage a 6t€ mutee 
sur deux positions par PGR, avec la paire d'amorces suivante, afin d^enlever deux 
phases de lecture ouvertes en amont du g^ne gfatl : 
30 - Start Xbal 

5' AATCTAGATTCATGCTCGAGCGGCCGCCAGTGTGATTGATATC 3' 
(SEQ ID NO: 16) 



25 
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-EndAfel 

5' ATTTTTATCAGAGCGCTGGGGGTGGCTATTGACAGG 3' (SEQ ID NO • 

17) 

selon le protocole : 9rC 2 mm, puis 30 cycles (94°C 15 sec, 55°C 30 sec, 68°C 1 min) 
suivis d'une polymerisation de 1 min k 68°C et retour k 4°C. 

Le fragment de PGR obtenu, contenant les deux mutations, a ^6 purifi6 sur gel 
SeaPlaque (Tebu) a 0,7% puis dig6r6 par Xbal et Afel pour remplacer son homologue 
dans pFastBac-gfat-His6 afin de donner le plasmide donneur pFastBac-gfat-ffis6-2orf 
servant k la transposition dans les cellules DHlOBac (Life Technologies Ltd). La 
construction a 6t6 v6rifi6e pax digestions Smal, XballPsiEl, XbaVHindm, et par 
s6quen9age. 

Un bacmide recombinant a 6t6 isol6 ^r6s transposition dans les cellules 
DHlOBac et utiKs6 pour transfecter des ceUules d'insecte Sf9 en pr6sence de Lipofectin 
(Life Technologies Ltd). Les baculovirus obtenus ont 6t6 ampUfi6s dans les cellules Sf9 
15 etletitre viral a 6t6mesur6i 5.10'' pfu/ml. 

2. Production de la prot6me GFAT1 -Hisfi 

Des cellules d'insectes Sf9 ont et6 cultiv6es a 28°C en presence de miUeu SF900n 
(Life Technologies Ltd) en fioles de 5 L sous agitation k 100 ipm. Les cellules a une 
20 densit6 de 2. lO' cellules /L ont ete infect6es par le baculovirus recombinant obtenu ci- 

dessus avec une multipUcit6 d'infection de 2 (pfu/cellule). puis cultiv6es durant 72 h. 

Les cellules et le sumageant ont 6t6 s6par^ par centrifugation (2500 g, 10 min ^ 
4°C). Les culots cellulaires ont 6t6 lav& en presence de tampon Tris-HCl 20 mM, pH 7, 
centrifuges (4000 g, 45 min i A°C) et congel6s k -SO'C. \ 

25 

* 

3. Purification de la prot6ine GFATT -Hisfi 

Le culot cellulaire (20 g) a 6t6 repris dans 50 ml de tampon de lyse (NaP04 50mM 
pH 7,5, NaCl 300 mM, imidazole 10 mM, fi:uctose-6-phosphate (fructose-6P) 1 mM, 
TCEP (Tris(2-caiboxyethyl)phosphine) 1 mM, PMSF 1 mM (fluorure de 
30 phdnyhnethylsulfonyl), 10% glycerol et 1 tablette de cocktail d'inhibiteurs de proteases 

sans EDTA (Roche AppUed Sciences) et soumis k un broyage au DynoMill k 4500 
trs/min (4 cycles de 30 sec) en presence de 40 g de microbilles de 0,2 mm de diamfetre. 
L'ensemble a 6t6 refroidi par circulation d'ethyl&ae glycol/eau r6gl6 k -IS^C. L'extrait 
brut obtenu (100 ml, 445 mg de prot6ines totales) a 6t6 centrifuge k 4<»C pendant 20 min 
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k 12000 tpm. Le sumageant a 6t6 soumis k mie ultracentrifugation k 4°C (350000 tpm, 
Ih). Le sumageant ainsi obtenu a 6t6 m61ang6 i 5 ml de matrice 50% Ni-NTA (Qiagen) 
pendant 2hk 4"'C. Le melange a 6t6 coul6 dans une colome vide puis rinc6 avec 40 ml 
de tampon de lavage (NaP04 50 mM pH 7.5. NaCl 300 mM. imidazole 40 mM. 
fructose-6P 1 mM, TCEP 1 mM, PMSF 1 mM et 1 tablette de cocktail d'inhibiteurs de 
proteases sans EDTA (Roche Applied Sciences). L'61ution a ete r6aUs6e par paHers 
successifs k 125 et 500 mM imidazole dans le m&ne tampon que pr6c6demment. 12 mg 
de GFAT1-His6 fonctiomielle (dosage prot6ique selon la m6thode de Bradford ont ainsi 
6t6 obtenus. 

4. Conservation de Tenzyme GFATI-FTigfi 

L'enzyme a alors 6t6 stockfe en fractions de 100 ^l en presence de 1 mM 
fructose-6P, ImM TCEP et 10% glycdrol k -80°C. La stabiUt6 de l'enzyme est de 
plusieurs mois i-SO^C et sup6rieure k 8 jours k 4°C. 

5. Dosage de l* activit6 de Tenzyme GFAT1-His6 

Dififdrents tests de dosage de l'activit6 enzymatique de la GFAT1-His6 ont 6t6 
utiUses. Ces tests peuvent 8tre 6galement utilis6s afin de cribler des composes 
modifiant, et notamment inhibant. I'activit6 de la GFAT1-His6. n est possible des les 
adapter ais^ent k un criblage k haut debit. 



Dosage de Morgan-Elson : 

Dans ce cas l'activit6 enzymatique est suivie par un test (Colorim6trique dont le 
prindpe est le suivant : la D-glucosamine-6P lib&6e par l'enzyme est N-ac6tyl6e par 
I'anhydride ac6tique en miUeu alcalin (Ghosh et al. Method. Enzymol (1962) 5:414). 
puis La solution est trait6e par le r6actif d'EhrUch (para-dim^yl-amino-benzalddhyde. 
PDAB) en milieu acide concentrd ; le compost rose form6 absorbe k 585 nm. 

La reaction enzymatique se d6roule pendant 30 min ^ 37°C en presence de : 
^0 - 0,2 ml de fructose-6P i 100 mM 

- 0,25 ml de L-Glutamine k 60 mM 

- 0,25 ml de tampon KPO4 4 150 mM pH 7 

- 0,1 ml d'EDTA (6thyl6ne diamine t6tra-ac6tate) k 25 mM, pH 7 
-jusqu'^ 200 nl d'6chantiUon (k completer avec H2O si ndcessaire) 
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La r6action est stopp6e par immersion 4 minutes dans un bain d'eau k 100'*C puis 
ccntrifug6e. 0,8 ml du sumageant sont pr61ev6s pour le dosage de la glucosamine-6P 
suivant le protocole suivant : 

- addition de 0,1 ml de NaHCOa satur6, 

5 - addition de 0,1 ml d'une solution d'anhydride ac6tique k 5 % dans I'eau 

pr6par6e extemporan6ment, 

- agitation et incubation 5 min k temperature ambiante, 
-incubation 5 min dans un bain a lOO^C, 

- addition de 0,2 ml de borate de potassium 0,8 M pH 9,1 (k ajuster avec KOH 
10 ION). 

-agitation et incubation 7 min dans un bain k lOO^C. 

-addition de 3 ml de r^actif dTEhrUch dilu6 10 fois dans I'acide ac6tique, 
pr6par6 extemporan&nent, sur la solution refroidie dans la glace, 

- incubation 20 min k 37°C. 

L'activitd de la GFAT k 6t6 d6tennin6e comparativement k une courbe 6talon 
6tabHe en utiUsant la D-glucosamine comme standard dans une gamme de concentration 
de 0 i 200 nmoles. L'activit6 sp6cifique de la GFAT1-His6 obtenue a et6 ainsi mesur6e 
k 1,7 U/mg. Ce qui est sup6rieur a la valeur de 0,4 U/mg obtenue par Broschat et al, J. 
Biol Chem. (2002) llTAAieA, pour la purification d'une GFATl humaine 
20 recombinante. Ceci traduit une activity sup6rieure de la GFAT1-His6 et/ou une puret6 

plus importante de la preparation enzymatique selon I'invention. 

Les parametres cin6tiques de la GFAT1-His6 ont 6t6 caract6ris6s vis-i-vis de la 
glutamine (KJ^ = 0,2 mM) et du fructose-6P (F6P) = 0.Q06 mM) par un dosage 

spectrophotomdtrique coupl6 k la glutamate d6shydrog6nase selon le test APAD. Ce qui 
est conforme aux valeurs cities dans I'art ant6rieur (Km°^ = 0,26 mM et Kn,"^ = 0,007 
mM pour Broschat et al, J, Biol Chem. (2002) IITAAIM). 
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Dosage APAD 

n s'agit d'un dosage spectrophotom6trique dans I'ultraviolet de I'activite GFAT. II 
est bas6 sur la determination, en continu, de la quantity de L-glutamate forme k I'aide de 
la GFAT et d'un analogue du NAD (nicotinamide adenine dinucieotide), I'APAD (3- 
acetylpyridine adenine dinucieotide), selon la reaction suivante (catalysee par la 
glutamate deshydrogenase (GDBQ) : 
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Of- c6toglutarate + NEU* + APADH 



La mesure s'effectue i 365 mn, i 37»C. Dans ces conditions une unit6 
d'absorbance correspond k 0,1 1 nmole d'APADH fomi6. 
L'essai comprrad : 

- 100 111 APAD 3 mM (2 mg/ml) 
-25 H1KC12M 

- 100 fil de tampon KPO4 1 M pH 7,2 

- 100 \xl de Fructose-6P 100 mM (30,41 mg/ml) 

- 100 nl de L-Glutamine 60 mM purifite (8,77 mg/ml) 

- H2O qsp 1 ml (en tenant compte des volumes k rajouter ci-aprte) 

- 50 ^l GDH 

- 6chantillon k doser : 0,5 ng 

n est 6galement possible d'utiliser d'autres proc6d6s de dosage, tels que le dosage 
radiom6trique d6crit par Broschat et al.. Analytical Biochem. (2002) 305:10-15 ou le 
dosage dit Nitro Bleu T6trazoUum d6crit par Nakata et al, J. Antibio. (2001) 54:737- 
743. 
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1. Prot&ne enzymatiquement active comprenant : 

- une sequence de GFAT et au moins une sequence d'une 6tiquette de 
5 purification, la s6quence de I'^tiquette de purification 6tant ins6r6e entre deux 

acide amines cons6cutifs de la sequence de GFAT, ou 

- une sequence d^rivant de la sequence pr6c6dente par suppression, insertion ou 
mutation d'au moins un acide amin6, sous r6serve que ladite prot6ine pr^sraite 
une activity enzymatique, ou 

- ^« s6quence pr&entant au moins 35 % d'identit6 de sequence et/ou au moins 
44 % de similarity de s6quence avec I'une des sequences pr6c6dentes, sous 
reserve que ladite prot6ine pr6sente une activit6 enzymatique. 



15 
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2. Prot^ine selon la revendication 1, dans laqueUe la s6quence de GFAT correspond k 
une sequence de GFAT de baot&ie ou d'eucaryote, notamment de plante, de 
champignon ou d'animal, en particuUer d'insecte ou de mammif^e, plus 
particuli^rement d'homme. 

3. Prot6ine selon la revendication 1 ou 2, dans laquelle la sequence de T^tiquette de 
purification est ins6r6e entre deux acides amin6s cons6cutife de la sequence de GFAT, 
lesdits acides amines 6tant compris dans : 

- une partie de la sequence de la GFAT correspondant et/ou 6tant homologue & la 
s6quence s'6tendant ^roximativement entire les acides amines 30 4 80 de la 
GFAT 6^ Escherichia coH, ou 

- une partie de la sequence de la GFAT correspondant et/ou 6tant homologue i la 
s6quence s'6tendant approximativement entre les acides amines 220 k 230 de la 
GFAT Escherichia coli, ou 

- une partie de la sequence de la GFAT correspondant et/ou 6tant homologue k la 
sequence s'6tendant approximativement entire les acides amines 235 k 250 de la 

^0 GFAT ^^Escherichia coli. 

4. Prot6ine selon I'une des revendication 1 3, dans laquelle la s6quence de l'6tiquette 
de purification est ins6r6e entire deux acides amin6s cons6cutifs de la sequence d'une 
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GFAT humaine, lesdits acides aminds tot compris entre les acides amin6s 40 k 50, 
290 k 330, et/ou 340 k 370 de ladite sequence de GFAT humaine. 

5. Piot6ine selon I'une des revendications 1 k 4, dans laqueUe la sequence de GFAT 
5 correspond k : 

- SEQ ID NO : 2, correspondant k la sequence de la GFATl humaine, 

- SEQ ID NO : 4, correspondant k la s6quence de la GFAT2 humaine, 

- SEQ ID NO : 6, correspondant la sequence de la GFATl Alt humame. 

10 6. Prot6ine selon I'une des revendications 1 ^ 5, dans laqueUe la s6quence de l'6tiquette 

de purification est ins6ree entre deux acides amines cons^cutifs, lesdits acides amin6s 
6tant compris entre les acides amin6s : 

- 43 k 47, 298 k 306, et/ou 342 k 347 de SEQ ID NO : 2 

- 42 k 45, 299 k 307, et/ou 343 k 348 de SEQ ID NO : 4 
15 - 43 i 47, 316 k 324, et/ou 360 k 365 de SEQ ID NO : 6 

7. Prot6ine selon la revendication 6, dans laqueUe la sequence de I'etiquette de 
purification est ins&-6e entre les acides amines : 

- 299 et 300 de SEQ ID NO : 2. 
20 - 300 et 301 de SEQ ID NO : 4 

- 317 et 318 de SEQ ID NO : 6 



8. Protaine selon I'une des revendications 1 ^ 7, dans laqueUe I'etiquette de purification 
conrespond k une sequence d'environ 2 k environ 10 acidfs aminfe, notamment 
d' environ 4 k environ 8 acides amin6s. 

9. Prot6ine selon I'une des revendications 1 i 8, dans laquelle I'etiquette de purification 
est une hexa-histidine. 



I. Piot6ine selon les revendications 7 et 9 correspondant aux sequences : 

- SEQ ID NO : 8, correspondant k la sequence SEQ ID NO : 2 dans laquelle 
hexa-histidine est inser^e entre les acides amines 299 et 300, 

- SEQ ID NO : 10, correspondant k la sequence SEQ ID NO : 4 dans laquelle 
hexa-histidine est ins6r6e entre les acides amines 300 et 301, et 
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- SEQ ID NO : 12. coirespondant k la sequence SEQ ID NO : 6 dans laqueUe une 
hexa-histidine est ins6r6e entre les acides amines 3 17 et 3 18. 

11. Acide nucl^ique comprenant ou 6tant constitu6 d'une s6quence codant pour une 
prot6ine selon Tune des revendications 1 i 10. 

12. Acide nucl6ique comprenant ou 6tant constitu^ de la sequence nucl6otidique : 

- SEQ ID NO : 7 codant pour la proteine SEQ ID NO : 8, ou 

- SEQ ID NO : 9 codant pour la prot6ine SEQ ID NO : 10, ou 

- SEQ ID NO : 1 1 codant pour la prot6ine SEQ ID NO : 12, 

ou de son compl6mentaire. ou 6tant d6riv6 de ladite sequence par mutation, insertion ou 
deletion d'au moins un nucleotide, sous reserve que ladite sequence nucldotidique code 
pour une prot6ine enzymatiquement active. 

13. Vecteur eucaryote ou procaryote comprenant un acide nucleique selon la 
revendication 1 1 ou 12. 

14. Proc6d6 de purification d'une proteine selon I'une des revendications lklO,k partir 
d'une solution comprenant ladite prot6ine, comprenant une 6tape de mise en pr6sence 
de ladite solution avec un compose se liant sp6cifiquement k I'etiquette de purification 
de ladite proteine et une 6tape de separation du complexe form6 par la Uaison de ladite 
prot6ine audit compos6 des autres constituants de la solution. 

15. Proc6d6 de purification selon la revendication 14, comprenaisit une etape de mise en 
presence d'une solution comprenant une prot6ine selon la revendication 10 avec un 
compos6 comprenant un cation m6taUique divalent tel que Ni^^ ou Co^*, notamment 
Ni^^ et une 6tape de separation du complexe form6 par la Uaison de la proteine audit 
compose des autres constituants de la solution. 

16. PiDc6d6 de conservation d'une proteine selon I'une des revendications 1 k 10 sous 
une fonne enzymatiquement active, notamment a -80°C ou k 4°C, comprenant 
I'adjonction de ladite proteine k une solution comprenant : 

- d'environ 1 mM k environ 10 mM de fructose 6-phosphate, notamment environ 
ImM, 
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- d'environ 1 mM k environ 5 mM de Tris(2-carboxyetiiyl)phosphine, 
notanunent environ 1 mM, 

- d'environ 5 % k environ 20 % de glyc6rol, notamment raviron 10%, 

17. Composition comprenant ime prot6ine GFAT active, le cas 6ch6ant li6e k une 
Etiquette de purification, telle qu'une proteine selon Tune des revendication 1 i 10, 
ladite proteine 6tant susceptible de pouvoir etre conserv6e sous une forme 
enzymatiquement active, durant au moins 8 jours k une temp6rature de I'^C k lO^C, 
notanxtnent environ 4°C, et durant au moins 12 mois k une temperature de -100°C k - 
20°C, notanunent environ -80°C, ladite prot6ine 6tant en association avec : 

- environ 1 mM a environ 10 mM de fructose 6-phosphate, notamment environ 1 
mM, 

- environ 1 mM k environ 5 mM de Tris(2-carboxyefliyl)phosphine, notamment 
environ 1 mM, 

- environ 5 % k environ 20 % de glyc6rol, notamment environ 10%. 

18. Utilisation d'une prot6ine selon Time des revendications 1 k 10, pour le criblage de 
composes modifiant ractivit6 de ladite prot6ine, en particulier pour le criblage 
d*inhibiteur de ladite prot6ine. 

19. Utilisation selon la revendication 18, pour le criblage de composes utiles dans le 
cadre du traitement ou de la prevention dn diabete, notamment du diabfete de type n, de 
robesit6, de Tacidose, de la c6tose, de Tarfhrite, des cancers, ou de I'osttoporose. 
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LISTE DE SEQUENCES 



<110> CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE 

<120> GLUTAMINE:PRUCTOSE-6-PHOSPHATE AMIDOTRANSPERASE (GFAT) COMPRENANT ITMP 
cSpSe? ^^"^CATION INTERNE. ET SON UTILISATION piS J^ SSf^E 



<130> WOB 03 BP CNR GPAT 



<160> 19 



<170> Patentin version 3.1 

<210> 1 

<211> 2046 

<212> ADN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (1) . . (2046) 

<223> 



<220> 

<221> misc_f eature 
<222> (170) . . (170) 
<223> t ou C 

<400> 1 

V^f H?^ ^"^^ ^^"^ tac cat gtt cot cga acg aga 48 

Met cys Gly He Phe Ala Tyr Leu Asn Tyr His Val Pro A?g tS? S 
^ 5 10 15 

cga gaa ate ctg gag acc eta ate aaa ggc ctt cag aga ctg gaq tac 96 

Arg Glu He Leu Glu Thr Leu He Lys Gly Leu Gin A?g LeS IS Jj? 

20 25 30 

aga gga tat gat tct get ggt gtg gga ttt gat gga ggc aat gat aaa 144 

Arg Gly Tyr Asp Ser Ala Gly Val Gly Phe Isp Gly lly Sn Ksp lJs 
3= 40 45 

l^^ 3°° =^9 ctt att aag aag aaa gga 192 

Asp Trp Glu Ala Asn Ala Cya Lys Xaa Gin Leu He LyI LyI Lys JlJ 

ttt f^^ f?^ aag caa caa gat atg gat 240 

Lys Val Lys Ala Leu Asp Glu Glu Val His Lys Gin Gin Asp Met Isp 

70 75 

f«« 11^ f^*" ""^^ ata get cat acc cgt tgg 

Leu Asp He Glu Phe Asp Val His Leu Gly He Ala His Thr Aig tS 
85 90 a P 



95 



288 



f?= agt cct gtc aat age cac ccc cag cqc tct 336 

Ala Thr His Gly Glu Pro Ser Pro Val Asn sir His Pro qS l?g ser 
100 105 HO ^ 



384 



f^* ate gtt att cac aat gga ate ate acc aac 

Asp Lys Asn Asn Glu Phe He Val He His Asn lly He ill ?Sr J^n 
lis 120 125 

tac aaa gac ttg aaa aag ttt ttg gaa age aaa ggc tat gac ttc qaa 432 

Tyr Lys Asp Leu Lys Lys Phe Leu Glu Ser Lys Gly Tyr Asp Ihe lJu 
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130 135 



140 



245 250 



255 



300 



get gtg caa aca etc cag atg gaa etc cag cag ate atg aag ggc aac 
Ala Val Gin Thr Leu Gin Met Glu Leu Gin Gil He Met LyI %ly 

315 J 320 

ttc agt tea ttt atg cag aag gaa ata ttt gag eag eca gag tct etc 
Phe Ser Ser Phe Met Qln Lys Glu He Phe Glu Gil Pro llu Ser ?al 



325 330 



335 



gtg aac aca atg aga gga aga gtc aae ttt gat gac tat act gta aat 
Val Asn Thr Met Arg Gly Arg Val Asn Phe Lp Lp Tyr ?Sr ?al SSn 
340 345 



350 



llf, f-^t T*"^ f^^ sag ate cag aga tgc egg cgt 

Leu Gly Gly Leu Lys Asp His He Lys Glu He Gin Aig C?s A?| J^g 
355 360 



365 



ttg att ett att get tgt gga aca agt tac cat get qgt qta aca aca 
Leu He Leu He Ala Cys Gly Thr Ser Tyr His La lly vll HI 

375 380 



cgt caa gtt ctt gag gag ctg act gag ttg cct gtg atg gtg gaa eta 
Arg Gin Val Leu Glu Glu Leu Thr Glu Leu Pro Val Met vll IS LeS 

390 395 400 



480 



528 



9°° °tc gtt aag tat atg tat 
ser Glu Thr Asp Thr Glu Thr He Ala Lys Leu Val Lys Tyr Met Tyr 

150 155 j^gO 

gac aat egg gaa agt caa gat aec age ttt act ace ttg gtg gag aqa 
Asp Asn Arg Glu Ser Gin Asp Thr Ser Phe Thr Thr Leu Val Glu A^g 
1S5 170 175 

gtt ate caa caa ttg gaa ggt get ttt gca ctt gtg ttt aaa agt gtt 576 
Val He Gin Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys Ser Val 
180 185 190 

11^ H?^ °9a ggt age cct ctg ttg 624 

His Phe Pro Gly Gin Ala Val Gly Thr Arg Arg Gly Ser Pro Leu Leu 
"5 200 205 

att ggt gta egg agt gaa cat aaa ctt tct act gat cac att cct ata 
He Gly Val Arg Ser Glu His Lys Leu Ser Thr Asp His He Pro He 
2X0 215 220 

t1?. ^ 9ac aag aaa gga age tgc aat etc tct cgt 

Leu Tyr Arg Thr Gly Lys Asp Lys Lys Gly Ser Cys Asn Leu Ser Arg 

230 235 240 

111 °°9 gtg gaa gaa aaa gca gtg gag 

Val Asp Ser Thr Thr Cys Leu Phe Pro Val Glu Glu Lys Ala Val Glu 



672 



720 



768 



^ «u 3^*" ^9t get gtc ata gaa cac acc aat cgc 816 

Tyr Tyr Phe Ala Ser Asp Ala Ser Ala Val He Glu His Thr Asn Arg 
260 265 270 

v«? ril 11^ 9tt gca gca gta gtg gat gga cgt 864 

Val He Phe Leu Glu Asp Asp Asp Val Ala Ala Val Val Lp Gly Arg 
275 280 285 

ctt tct ate eat cga att aaa ega act gca gga gat cac cec gga ega 
Leu Ser He His Arg He Lys Arg Thr Ala Gly Lp His Pro GlJ 

290 295 ^3 



912 



960 



1008 



1056 



1104 



1152 



1200 
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gca agt gac ttc ctg gac aga aac aca cca gtc ttt cga gat gat gtt 1248 
Ala Ser Asp Phe Leu Asp Arg Asn Thr Pro Val Phe Arg Asp Asp Val 
405 410 415 

tgc ttt ttc ctt agt caa tea ggt gag aca gca gat act ttg atg ggt 1296 
Cys Phe Phe Leu Ser Gin Ser Gly Glu Thr Ala Asp Thr Leu Met Gly 
420 425 430 

ctt cgt tac tgt aag gag aga gga got tta act gtg ggg ate aca aac 1344 
Leu Arg Tyr Cys Lys Glu Arg Gly Ala Leu Thr Val Gly lie Thr Asn 
435 440 445 

aca gtt ggc agt tec ata tea egg gag aca gat tgt gga gtt cat att 1392 
Thr Val Gly Ser Ser He Ser Arg Glu Thr Asp Cys Gly Val His He 
450 455 460 

aat get ggt cct gag att ggt gtg gee agt aea aag get tat ace age 1440 
Asn Ala Gly Pro Glu He Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser 

470 475 480 

IV f^f ''^^ a^*" ^tg atg tgt gat gat egg 1488 

Gin Phe Val Ser Leu Val Met Phe Ala Leu Met Met Cys Asp Asp Arg 
485 490 495 

ate tec atg caa gaa aga cgc aaa gag ate atg ctt gga ttg aaa egg 1536 
lie Ser Met Gin Glu Arg Arg Lys Glu He Met Leu Gly Leu Lys Arg 
500 505 510 

ctg cct gat ttg att aag gaa gta ctg age atg gat gac gaa att eag 1584 
Leu Pro Asp Leu He Lys Glu Val Leu Ser Met Asp Asp Glu He Gin 
515 520 



525 



act 



1632 



aaa eta gca aea gaa ctt tat cat eag aag tea gtt ctg ata atg gga 
Lys Leu Ala Thr Glu Leu Tyr His Gin Lys Ser Val Leu He Met Glv 
530 535 540 ' 

9Ct act tgt ctt gaa ggg gca ctg aaa ate aaa 1680 
Arg Gly Tyr Hxs Tyr Ala Thr Cys Leu Glu Gly Ala Leu Lys He Lvs 
545 550 555 560 

^V tZ^ 3aa gge ate ctt get ggt gaa ttg aaa 1728 

Glu He Thr Tyr Met His Ser Glu Gly He Leu Ala Gly Glu Leu Lys 
565 570 575 

S?= n?f S"*" "9 3^? *^t9 atg cct gtg ate atg'' ate 1776 

Hxs Gly Pro Leu Ala Leu Val Asp Lys Leu Met Pro Val He Met He 
580 585 590 

9°° a^Sr tgt eag aat get ctt cag caa 1824 
He Met Arg Asp Hxs Thr Tyr Ala Lys Cys Gin Asn Ala Leu Gin Gin 
595 600 605 

Va? v»? f?^ ^9*^ sat aag gag gat 1872 

Val Val Ala Arg Gin Gly Arg Pro Val Val He Cys Asp Lys Glu Asp 
610 615 620 



1920 



Thr Glu Thr He Lys Asn Thr Lys Arg Thr He Lys Val Pro His Ser 
"5 630 635 640 

gtg gac tgc ttg cag ggc att etc age gtg ate cot tta cag ttg ctg 1968 
Val Asp Cys Leu Gin Gly He Leu Ser Val He Pro Leu Gin Leu Leu 
645 650 655 
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get ttc cac ctt get gtg ctg aga ggc tat gat gtt gat ttc cca egg 
Ala Phe His Leu Ala Val Leu Arg Gly Tyr Asp Val Asp Phe Pro Arg 

665 670 



2016 



aat ctt gcc aaa tct gtg act gta gag tga 2046 
Asn Leu Ala Lys Ser Val Thr val Glu 

680 





675 


<210> 


2 


<211> 


681 


<212> 


PRT 


<213> 


Homo 


<220> 




<221> 


misc 


<222> 


(57)' 


<223> 


Le 


<400> 


2 



Met Cys Gly lie Phe Ala Tyr Leu Asn Tyr His Val Pro Arg Thr Arg 
1 5 10 15 

Arg Glu lie Leu Glu Thr Leu lie Lys Gly Leu Gin Arg Leu Glu Tyr 
20 25 30 

Arg Gly Tyr Asp Ser Ala Gly Val Gly Phe Asp Gly Gly Asn Asp Lys 
35 40 45 

Asp Trp Glu Ala Asn Ala Cys Lys Xaa Gin Leu lie Lys Lys Lys Gly 
50 55 60 

Lys Val Lys Ala Leu Asp Glu Glu Val His Lys Gin Gin Asp Met Asp 
65 70 75 80 

Leu Asp lie Glu Phe Asp Val His Leu Gly He Ala His Thr Arg Trp 
85 90 95 

Ala Thr His Gly Glu Pro Ser Pro Val Asn Ser His Pro Gin Ard? Ser 
100 105 110 

Asp Lys Asn Asn Glu Phe He Val He His Asn Gly He He Thr Asn 
115 120 125 

Tyr Lys Asp Leu Lys Lys Phe Leu Glu Ser Lys Gly Tyr Asp Phe Glu 
130 135 140 

Ser Glu Thr Asp Thr Glu Thr He Ala Lys Leu Val Lys Tyr Met Tyr 
"5 150 155 3^gQ 



Asp Asn Arg Glu Ser Gin Asp Thr Ser Phe Thr Thr Leu Val Glu Arg 
165 170 175 
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Val lie Gin Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys Ser Val 
180 185 190 

His Phe Pro Gly Gin Ala Val Gly Thr Arg Arg Gly Ser Pro Leu Leu 
195 200 205 

lie Gly Val Arg Ser Glu His Lys Leu Ser Thr Asp His lie Pro He 
210 215 220 

Leu Tyr Arg Thr Gly Lys Asp Lys Lys Gly Ser Cys Asn Leu Ser Arg 
225 230 235 240 

Val Asp Ser Thr Thr Cys Leu Phe Pro Val Glu Glu Lys Ala Val Glu 
245 250 255 

Tyr Tyr Phe Ala Ser Asp Ala Ser Ala Val He Glu His Thr Asn Arg 
260 265 270 

Val He Phe Leu Glu Asp Asp Asp Val Ala Ala Val Val Asp Gly Arg 
275 280 285 

Leu Ser He His Arg He Lys Arg Thr Ala Gly Asp His Pro Glv Ara 
290 295 300 

Ala Val Gin Thr Leu Gin Met Glu Leu Gin Gin He Met Lys Gly Asn 
305 310 315 320 

Phe Ser Ser Phe Met Gin Lys Glu He Phe Glu Gin Pro Glu Ser Val 
325 330 335 

Val Asn Thr Met Arg Gly Arg Val Asn Phe Asp Asp Tyr Thr Val Asn 
340 345 350 

Leu Gly Gly Leu Lys Asp His He Lys Glu He Gin Arg Cys Arg Arg 
355 360 365 ' 

Leu He Leu He Ala Cys Gly Thr Ser Tyr His Ala Gly Val Ala Thr 
370 375 380 

Arg Gin Val Leu Glu Glu Leu Thr Glu Leu Pro Val Met Val Glu Leu 

390 395 400 

Ala Ser Asp Phe Leu Asp Arg Asn Thr Pro Val Phe Arg Asp Asp Val 
405 410 415 

Cys Phe Phe Leu Ser Gin Ser Gly Glu Thr Ala Asp Thr Leu Met Gly 
420 425 430 

Leu Arg Tyr Cys Lys Glu Arg Gly Ala Leu Thr Val Gly He Thr Asn 
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435 440 445 

Thr val Gly Ser Ser lie Ser Arg Glu Thr Asp Cys Gly Val His lie 
450 455 460 

Asn Ala Gly Pro Glu He Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser 
465 470 475 480 

Gin Phe Val Ser Leu Val Met Phe Ala Leu Met Met Cys Asp Asp Arg 
485 490 495 

He Ser Met Gin Glu Arg Arg Lys Glu He Met Leu Gly Leu Lys Arg 
500 505 510 

Leu Pro Asp Leu He Lys Glu Val Leu Ser Met Asp Asp Glu He Gin 
515 520 525 

Lys Leu Ala Thr Glu Leu Tyr His Gin Lys Ser Val Leu He Met Gly 
530 535 540 

Arg Qly Tyr His Tyr Ala Thr Cys Leu Glu Gly Ala Leu Lys He Lys 

550 555 560 

Glu He Thr Tyr Met His Ser Glu Gly He Leu Ala Gly Glu Leu Lys 
565 570 575 

His Gly Pro Leu Ala Leu Val Asp Lys Leu Met Pro Val He Met He 
580 585 590 

He Met Arg Asp His Thr Tyr Ala Lys Cys Gin Asn Ala Leu Gin Gin 
595 600 605 

Val Val Ala Arg Gin Gly Arg Pro Val Val He Cys Asp Lys Glu Asp 

615 620 

{ 

Thr Glu Thr He Lys Asn Thr Lys Arg Thr He Lys Val Pro His Ser 
"5 630 635 640 

Val Asp cys Leu Gin Gly He Leu Ser Val He Pro Leu Gin Leu Leu 
645 650 655 

Ala Phe His Leu Ala Val Leu Arg Gly Tyr Asp Val Asp Phe Pro Arg 
660 665 670 

Asn Leu Ala Lys Ser Val Thr Val Glu 
675 680 



<210> 3 
<211> 2049 
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<212> ADN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (1)..(2049) 

<223> 

<400> 3 

tlf I't^ ^^"^ ^^"^ aac tac aga gtc ccc egg acg agg 48 

Met Cys Gly lie Phe Ala Tyr Met Asn Tyr Arg Val Pro Arg Thr Arg 
15 10 15 

aag gag ate ttc gaa acc etc ate aag ggc ctg cag egg ctg gag tac 96 
Lys Qlu He Phe Qlu Thr Leu He Lys Gly Leu Gin aII LeS Gl? Sr 
20 25 30 

t^^ gca ggt gtg gcg ate gat ggg aat aat cae gaa 144 

Arg Gly Tyr Asp Ser .Ala Gly Val Ala He Asp Gly Asn Asn His Ilu 
35 40 45 

gtc aaa gaa aga eae att eag ctg gtc aag aaa agg ggg aaa gtc aag 192 
Val Lys Glu Arg His He Gin Leu Val Lys Lys A^i If? Lys ?al Si 
50 55 



60 



get etc gat gaa gaa ctt tac aaa caa gac age atg gac tta aaa gtg 
Ala Leu Asp Glu Glu Leu Tyr Lys Gin Asp Ser Met Asp Leu Lys Val 



75 80 



gag ttt gag aca cac ttc ggc att gee cae acg cgc tag gee acc cac 
Glu Phe Glu Thr His Phe Gly He Ala His ThI A?g T?? A?a His 
85 90 



95 



125 



240 



288 



ggg gtc ccc agt get gtc aac age cac cct cag cgc tea gac aaa ggc 336 
Gly val Pro Ser Ala Val Asn Ser His Pro Gin A^g Ser Isp Lys Gly 
100 105 110 

aac gaa ttt gtt gtc ate cac aat ggg ate ate aca aat tac aaa aat 3 84 

Asn Glu Phe val Val He His Asn Gly He He Thr Asn Tyr lyl ?sp 
1x5 120 



432 



480 



528 



ctg agg aaa ttt ctg gaa age aaa ggc tac gag ttt gag tea gaa aca 
Leu Arg Lys Phe Leu Glu Ser Lys Gly Tyr Glu Phe Qlu Ser Glu Thr 

135 140 

fo^ ° ctg att aaa tat gtg ttc gae aac^ aga 

Asp Thr Glu Thr He Ala Lys Leu He Lys Tyr Val Phe Lp Asn A?g 

150 155 3^g= 

gaa act gag gac att acg ttt tea acg ttg gtc gag aga gtc att eaa 
Glu Thr Glu Asp He Thr Phe Ser Thr Leu Val Gl? tS^ vll He 
165 170 175 

cag ttg gaa ggt gca ttc gcg ctg gtt ttc aag agt gtc cae tac cea 576 
Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys slr Val His Tyr PrS 
180 185 190 

gga gaa gee gtt gee aca egg aga ggc age ecc ctg etc ate gga gtc 624 
Gly Glu Ala val Ala Thr Arg Arg Gly Ser Pro Leu Leu He GlJ vll 
195 200 205 

egg age aaa tac aag etc tec aca gaa cag ate cct ate tta tac agg 672 
Arg ser Lys Tyr Lys Leu Ser Thr Qlu Gin He Pro He Leu TV? 
210 215 220 
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1^° ate tgt aag aca egg atg aag 

Thr Cys Thr Leu Glu Asn Val Lys Asn lie Cys Lys Thr Arg Met Lys 
225 230 235 240 



405 410 



415 



720 



agg ctg gac age tec goo tgc ctg cat get gtg ggc gac aag gcc gtg 768 
Arg Leu Asp Ser Ser Ala Cys Leu His Ala Val Qly Asp Lys Ala Val 
245 250 255 

It*^ f?*" Sr°* get ate ata gag eac ace aae 816 

Glu Phe Phe Phe Ala Ser Asp Ala Ser Ala lie lie Glu His Thr Asn 
260 265 270 

egg gtc ate ttc ctg gag gac gat gac ate gcc gca gtg get gat ggg 864 
Arg Val lie Phe Leu Glu Asp Asp Asp lie Ala Ala Val lla Lp Gl? 
275 280 285 

aaa etc tec att eac egg gtc aag ogc teg gee agt gat gac cea tct 912 
Lys Leu Ser He His Arg Val Lys Arg Ser Ala sir Lp Asp Prl Ser 

300 



960 



1008 



290 295 

cga gcc ate cag ace ttg cag atg gaa ctg eag caa ate atg aaa ggt 
Arg Ala He Gin Thr Leu Gin Met Glu Leu Gin Gin He Met Lys Gly 

310 315 320 

t^^ 9^9 ate ttc gaa cag cea gaa tea 

Asn Phe Ser Ala Phe Met Gin Lys Glu He Phe Glu Gin Pro Glu Ser 
325 330 335 

Ill t^f ""39 ace aae aca gtg 1056 

Val Phe Asn Thr Met Arg Gly Arg Val Asn Phe Glu Thr Asn Thr Val 
340 345 350 

etc ctg ggt ggc ttg aag gac eac ttg aag gag att cga cga tgc cga 1104 
Leu Leu Gly Gly Leu Lys Asp His Leu Lys Glu He A^g A?g C?s A?g 
355 360 365 

egg etc ate gtg att ggc tgt gga ace age tac cac get gee gtg get 1152 
Arg Leu He Val He Gly Cys Gly Thr Ser Tyr His Ila Ila Val Ila 
370 375 3gQ 

acg egg caa gtt ttg gag gaa ctg act gag ett cet gtg atg gtt gaa 1200 
Thr Arg Gin Val Leu Glu Glu Leu Thr Glu Leu Pro Val Met Val IS 

390 395 400 

ett get agt gat ttt ctg gac agg aac aca cct gtg ttc agg gat .qac 1248 
Leu Ala Ser Asp Phe Leu Asp Arg Asn Thr Pro lal Phe A?| I^p ^Ssp 



^= II »v 9gc gag acc gcg gac ace etc ctg 1296 

Val Cys Phe Phe He Ser Gin Ser Gly Glu Thr Ala Asp Thr Leu Leu 

420 425 430 

gcg ctg cgc tac tgt aag gac cgc ggc get etc acc gtg ggc gtc acc 1344 

Ala Leu Arg Tyr Cys Lys Asp Arg Gly Ala Leu Thr Val lly ?al Th? 
435 440 445 

HI Thr S? o°° 1°^ *^9° 99° 9te cac 1392 

Asn Thr Val Gly Ser Ser He Ser Arg Glu Thr Asp Cys Gly Val His 
4=0 455 460 



ill 111 f?* 3?'' 9^9 gcc age ace aag get tat ace 1440 

He Asn Ala Gly Pro Glu Val Gly Val Ala Ser Thr Lys Ala Tyr Thr 

470 475 430 

agt cag ttc ate tct ctg gtg atg ttt ggt ttg atg atg tct gaa gac 1488 
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Ser Gin Phe lie Ser Leu Val Met Phe Gly Leu Met Met Ser Glu Asp 
485 490 495 

cga att tea eta caa aac agg agg caa gag ate ate egt ggc ttg aga 1536 
Arg He Ser Leu Qln Asn Arg Arg Qln Glu lie lie Arg Gly Leu Art? 
500 505 510 

tct tta cct gag ctg ate aag gaa gtg ctg tct ctg gag gag aag ate 1584 
Ser Leu Pro Glu Leu He Lya Glu Val Leu Ser Leu Glu Glu Lys He 
515 520 525 

cac gac ttg gee ctg gag etc tac acg cag aga teg etg ctg gtg atg 1632 
Hxs Asp Leu Ala Leu Glu Leu Tyr Thr Gin Arg Ser Leu Leu Val Met 
530 535 540 

ggg egg ggc tac aac tat gee aec tgc ctg gaa gga gee ctg aaa att 1680 
Gly Arg Gly Tyr Asn Tyr Ala Thr Cys Leu Glu Gly Ala Leu Lys He 

550 555 560 

aaa gag ata ace tac atg cac tea gaa ggc ate etg get ggg gag ctg 1728 
Lys Glu He Thr Tyr Met His Ser Glu Gly He Leu Ala Gly Glu Leu 
56S 570 575 

f,^f S?^ Z""^ '^^^ 9^° atg ece gtc ate atg 

Lys His Gly Pro Leu Ala Leu He Asp Lys Gin Met Pro Val He Met 
580 585 590 

gtc att atg aag gat cct tgc ttc gee aaa tgc eag aac gee ctg cag 
Val He Met Lys Asp Pro Cys Phe Ala Lys Cys Gin Asn Ala Leu Gin 
595 600 605 

caa gtc acg gee egc eag ggt ege ecc att ata ctg tgc tec aag gae 1872 
Gin Val Thr Ala Arg Gin Gly Arg Pro He He Leu C?s Ser Lyl 

610 615 620 if 

gat act gaa agt tec aag ttt gcg tat aag aca ate gag ctg cec cac 1920 
Asp Thr Glu Ser Ser Lys Phe Ala Tyr Lys Thr He Glu Leu Pro His 

630 635 640 

act gtg gac tgc etc cag ggc ate ctg age gtg att ccg ctg cag ctg 1968 
Thr Val Asp , cys Leu Gin Gly He Leu Ser Val He Pro Leu Gin Leu 
645 650 655 

rlf, "^'^ "^"^ 93^ tat gae gtt gae ttc cec 2016 

Leu Ser Phe His Leu Ala Val Leu Arg Gly Tyr Asp Val Asp Phe. Pro 
660 665 670 ' 

aga aat etg gee aag tct gta act gtg gaa tga 2049 
Arg Asn Leu Ala Lys Ser Val Thr Val Glu 
675 680 



1776 



1824 



<210> 4 

<211> 682 

<212> PRT 

<213> Homo sapiens 

<400> 4 

Met Cys Gly He Phe Ala Tyr Met Asn Tyr Arg Val Pro Arg Thr Arg 
^5 10 15 



Itys Glu He Phe Glu Thr Leu He Lys Gly Leu Gin Arg Leu Glu Tvr 
20 25 30 
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Arg Qly Tyr Asp Ser Ala Gly Val Ala lie Asp Gly Asn Asn His Glu 
35 40 45 

Val Lys Glu Arg His He Gin Leu Val Lys Lys Arg Gly Lys Val Lys 
50 55 60 

Ala Leu Asp Glu Glu Leu Tyr Lys Gin Asp Ser Met Asp Leu Lys Val 
" 70 75 80 

Glu Phe Glu Thr His Phe Qly He Ala His Thr Arg Trp Ala Thr His 
85 90 95 

Gly Val Pro Ser Ala Val Asn Ser His Pro Gin Arg Ser Asp Lys Gly 
100 105 110 

Asn Glu Phe Val Val He His Asn Gly He He Thr Asn Tyr Lys Asp 
lis 120 125 " " 

Leu Arg Lys Phe Leu Glu Ser Lys Gly Tyr Glu Phe Glu Ser Glu Thr 
130 135 

Asp Thr Glu Thr He Ala Lys Leu He Lys Tyr Val Phe Asp Asn Arg 
"5 150 155 165 

Glu Thr Glu Asp He Thr Phe Ser Thr Leu Val Glu Arg Val He Gin 
165 170 175 

Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys Ser Val His Tyr Pro 
180 185 190 

Gly Glu Ala Val Ala Thr Arg Arg Qly Ser Pro Leu Leu He Gly Val 
195 200 205 

i 

Arg Ser Lys Tyr Lys Leu Ser Thr Glu Gin He Pro He Leu Tyr Arg 
210 215 220 

Thr Cys Thr Leu Glu Asn Val Lys Asn He Cys Lys Thr Arg Met Lys 

230 235 240 

Arg Leu Asp Ser Ser Ala Cys Leu His Ala Val Gly Asp Lys Ala Val 
245 250 255 

Glu Phe Phe Phe Ala Ser Asp Ala Ser Ala He He Glu His Thr Asn 
260 265 270 

Arg Val He Phe Leu Glu Asp Asp Asp He Ala Ala Val Ala Asp Glv 
275 2B0 285 
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Lys Leu Ser lie His Arg Val Lys Arg Ser Ala Ser Asp Asp Pro Ser 
290 295 300 

Arg Ala He Gin Thr Leu Gin Met Glu Leu Gin Gin He Met Lys Glv 

310 315 320 

Asn Phe Ser Ala Phe Met Gin Lys Qlu He Phe Glu Gin Pro Glu Ser 
325 330 335 

Val Phe Asn Thr Met Arg Qly Arg Val Asn Phe Glu Thr Asn Thr Val 
340 345 350 

Leu Leu Gly Gly Leu Lys Asp His Leu Lys Glu He Arg Arg Cys Arg 
355 360 365 

Arg Leu He Val He Gly Cys Gly Thr Ser Tyr His Ala Ala Val Ala 
370 375 380 

Thr Arg Gin Val Leu Glu Glu Leu Thr Glu Leu Pro Val Met Val Glu 

390 395 

Leu Ala Ser Asp Phe Leu Asp Arg Asn Thr Pro Val Phe Arg Asp Asp 
405 410 415 

Val Cys Phe Phe He Ser Gin Ser Gly Glu Thr Ala Asp Thr Leu Leu 
420 425 430 

Ala Leu Arg Tyr Cys Lys Asp Arg Gly Ala Leu Thr Val Gly Val Thr 
435 440 445 

Asn Thr Val Gly Ser Ser He Ser Arg Glu Thr Asp Cys Gly Val His 

455 460 

He Asn Ala Gly Pro Glu Val Gly Val Ala Ser Thr Lys Ala Tyr^' Thr 

470 475 480 

Ser Gin Phe He Ser Leu Val Met Phe Gly Leu Met Met Ser Glu Asp 
485 490 495 

Arg He Ser Leu Gin Asn Arg Arg Gin Glu He He Arg Gly Leu Arg 
500 505 510 

Ser Leu Pro Glu Leu He Lys Glu Val Leu Ser Leu Glu Glu Lys He 
515 520 525 

His Asp Leu Ala Leu Glu Leu Tyr Thr Gin 2Vrg Ser Leu Leu Val Met 
530 535 540 
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Gly Arg Gly Tyr Asn Tyr Ala Thr Cys Leu Glu Gly Ala Leu Lys He 
545 550 555 560 

Lys Glu He Thr Tyr Met His Ser Glu Gly He Leu Ala Gly Glu Leu 
565 570 575 

Lys His Gly Pro Leu Ala Leu He Asp Lys Gin Met Pro Val He Met 
580 585 590 

Val He Met Lys Asp Pro Cys Phe Ala Lys Cys Gin Asn Ala Leu Gin 
595 600 605 

Gin Val Thr Ala Arg Gin Gly Arg Pro lie He Leu Cys Ser Lys Asp 
610 615 620 

Asp Thr Glu Ser Ser Lys Phe Ala Tyr Lys Thr He Glu Leu Pro His 
"5 630 635 640 

Thr Val Asp Cys Leu Gin Gly He Leu Ser Val He Pro Leu Gin Leu 
645 650 655 

Leu Ser Phe His Leu Ala Val Leu Arg Gly Tyr Asp Val Asp Phe Pro 
660 665 670 

Arg Asn Leu Ala Lys Ser Val Thr Val Glu 
675 680 



<210> 


5 
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<221> 


misc feature 


<222> 


(170) . . (170) 


<223> 


t ou c 


<400> 


5 



48 



96 



atg tgt ggt ata ttt get tac tta aac tac cat gtt act cga acg aga 
Met Cys Gly He Phe Ala Tyr Leu Asn Tyr His Val Pro Arg Thr Arg 
^5 10 15 

cga gaa ate ctg gag acc eta ate aaa ggc ctt cag aga etg gag tae 
Arg Glu He Leu Glu Thr Leu He Lys Gly Leu Gin Arg Leu Glu Tyr 
20 25 30 

aga gga tat gat tet get ggt gtg gga ttt gat gga gge aat gat aaa 144 
Arg Gly Tyr Asp Ser Ala Gly Val Gly Phe Asp Gly Gly Asn Asp Lys 
35 40 45 
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gat tgg gaa gcc aat gcc tgc aaa anc cag ctt att aag aag aaa gga 192 
Asp Trp Glu Ala Asn Ala Cys Lys Xaa Gin Leu He LyI LyJ Lys lly 

^ 60 

ftt til f?^ r^^ f^^ Hf^ *=^° a^ar caa caa gat atg gat 240 

Lys Val Lys Ala Leu Asp Glu Glu Val His Lys Gin Qln Asp Met Asp 

70 75 go** 

ttg gat ata gaa ttt gat gta cae ctt gga ata get cat acc cqt taa 2 as 

Leu Asp lie Glu Phe Asp Val His Leu Sly He Ila His Jh? Sg ig 
85 90 95 

gca aca cat gga gaa ccc agt cct gtc aat age cac ccc cag ceic tct 336 
Ala Thr His Gly Glu Pro Ser Pro Val Asn sir His Pro gS I?g Ser 
100 105 ^ 



110 



f 9tt att cac aat gga ate ate acc aac 
Asp Lys Asn Asn Glu Phe lie Val lie His Asn Gly He He Thr Asn 
115 120 



125 



384 



624 



tao aaa gac ttg aaa aag ttt ttg gaa age aaa ggc tat gac ttc gaa 432 
Tyr Lys Asp Leu Lys Lys Phe Leu Glu Ser Lys Gly Tyr Lp Phe IS 
IjO 135 U^^Q 

l^^ H?* 9^9 9°° aag etc gtt aag tat atq tat 480 

ser Glu Thr Asp Thr Glu Thr He Ala Lyi Leu Val LyI Ty^ Se? 

150 155 j^gQ 

gaa agt caa gat acc age ttt act acc ttg gtg gag acia 528 
Asp Asn Arg Glu Ser Gin Asp Thr Ser Phe Thr Thr Leu Val 111 S?S 
165 170 175 

gtt ate caa caa ttg gaa ggt get ttt gca ctt gtg ttt aaa agt gtt 57S 
Val He Gin Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys sIr Val 
180 185 190 

999 °aa gca gtt ggc aca agg cga ggt age cct eta tta 
Hxs Phe Pro Gly Qln Ala Val Gly Thr aI| A?g lly sir ?ro Lei ^el 
195 200 205 

Til Fr^'f ^9t gaa cat aaa ctt tct act gat cac att cct ata 

He Gly Val Arg Ser Glu Hxs Lys Leu Ser Thr Asp His He Pro He 
210 215 220 

etc tac aga aca get agg act cag att gga tea aaa ttc aca egg tgg 
Leu Tyr Arg Thr Ala Arg Thr Qln He Gly ser Lys Phe Thr JaV 

230 235 240 

99a tea cag gga gaa aga ggc aaa gac aag aaa gga age tgc aat etc 768 
Gly Ser Gin Gly Qlu Arg Gly Lys Asp Lys Lys lly sir C?8 Ssn LeS 
245 250 255 

III 111 111 fo° tZ^ tZ"" 1^° °=9 gtg gaa gaa aaa gca 816 

ser Arg Val Asp Ser Thr Thr Cys Leu Phe Pro Val Glu Glu Lys Ala 
260 265 270 

?a? rif, 9ca agt get gtc ata gaa cac acc 864 

Val Glu Tyr Tyr Phe Ala Ser Asp Ala Ser Ala Val He Glu His Thr 
275 280 285 

aat cgc gtc ate ttt ctg gaa gat gat gat gtt gca gca gta gtg gat 912 
Asn Arg Val He Phe Leu Glu Asp Asp Lp Val Ila Ila ?al ?al Up 
290 295 300 

gga cgt ctt tct ate cat cga att aaa cga act gca gga gat cac ccc 960 



672 



720 
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Gly Arg Leu Ser He His Arg He Lys A^g^ihr Ala Gly Asp His Pro 

310 315 320 

gga cga get gtg caa aca etc cag atg gaa etc caq caa ate ata aaa mno 
Gly Arg Ala Val Gin Thr Leu Gil Mel Glu Leu HI 111 Set Sf 
325 330 335 

n?f t^^ cag aag gaa ata ttt gag cag cca gag 1056 

Gly Asn Phe Ser Ser Phe Met Gin Lys Glu He Phe Glu Gin Pro Glu 
340 345 35Q 

til ?r!? fr*"? 9ga aga gtc aac ttt gat gac tat act 1104 

ser val Val Asn Thr Met Arg Gly Arg Val Asn Phe Aap Asp Tyr Thr 
355 360 



365 



S*"? 33*= eac ata aag gag ate cag aga tqc 

Val Asn Leu Gly Gly Leu Lys Asp His He LyI llu He III ^1 

375 380 

egg cgt ttg att ctt att get tgt gga aca agt tac cat get qqt qta 
Arg Arg Leu He Leu He Ala Cys Gly Thr sir Tyr His Sa lly vll 

390 395 400 

f tl^ 3*"^ 9^9 °tg act gag ttg cct gtg atq qtq 

Ala Thr Arg Gin Val Leu Glu Glu Leu Thr Glu Leu Pro ?al nil vll 
405 410 415 

r?,^ r^^ 9^° aca cca gte ttt cga gat 

Glu Leu Ala Ser Asp Phe Leu Asp Arg Asn Thr Pro Val Phe A?g Asp 
420 425 *^ 



430 



aca aac aca gtt ggc agt tec ata tea egg gag aca qat tqt aaa att 
Thr Asn Thr Val Gly Ser Ser He Ser A?| ll? T^r Sp gs GlJ vll 

470 475 ' 430 

Hi^ r^l S?*" """^ 9gt gtg gcc agt aca aag get tat 

His He Asn Ala Gly Pro Glu He Gly Val Ala Ser Thr LyI Ala .Tyr 
485 490 ' f ^ 

ace age cag ttt gta tec ctt gtg atg ttt gcc ctt atg atg tqt qat 
Thr ser Gin Phe Val Ser Leu Val Mel Phe Ila Leu Se? Me? gs IsJ 

500 505 



510 



525 



aaa egg ctg cct gat ttg att aag gaa gta ctg age atg gat gac aaa 
Lys Arg Leu Pro Asp Leu He Lys Glu Val Le? sir Me? IsJ Isp III 

535 540 

r^l If^ f^^ 9ca aca gaa ctt tat cat cag aag tea gtt ctg ata 

He Gin Lys Leu Ala Thr Glu Leu Tyr His Gin LyI Ser ?al LeS He 



550 555 



560 



atg gga ega ggc tat eat tat get act tgt ctt gaa ggg gca ctq aaa 
Met Gly Arg Gly Tyr His Tyr Ala Thr C^s Leu Glu If? M.I Le? lJs 



1152 



1200 



1248 



1296 



1344 



gat gtt tge ttt ttc ctt agt caa tea ggt gag aca gca gat act tta 
Asp Val cys Phe Phe Leu Ser Gin Ser Gly 111 Thr III Isp ?S III 

435 440 4.45 

nit 9Ct tta act gtg ggg ate 1392 

Met Gly Leu Arg Tyr Cys Lys Glu Arg Gly Ala Leu Thr Val Gly He 



1440 



1488 



1536 



gat egg ate tee atg caa gaa aga egc aaa qaa ate ata ctt- crcra fi-rr icoyi 
Asp Arg He Ser Met Gin Glu Alg A^g Lys III III Se? Ill IfJ 

515 520 



1632 



1680 



1728 
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565 570 575 

ate aaa gaa att act tat atg cac tct gaa ggc ate ctt get ggt gaa 1776 
lie Lys Glu He Thr Tyr Met His Ser Glu Gly He Leu Ala Gly Glu 
580 585 590 

ttg aaa cat ggc cct etg get ttg gtg gat aaa ttg atg act gtg ate 1824 
Leu Lys His Gly Pro Leu Ala Leu Val Asp Lys Leu Met Pro Val lie 
595 600 605 

m2 ril ril M^? ""^^ tgt cag aat get ctt 1872 

Met lie He Met Arg Asp His Thr Tyr Ala Lys Cys Gin Asn Ala Leu 
610 615 620 

ri^ ni^ w^? fr^n ""f^ ^^^^ 9*^9 tgt gat aag 1920 

Gin Gin Val Val Ala Arg Gin Gly Arg Pro Val Val He Cys Asp Lys 

^30 635 640 

gag gat act gag acc att aag aac aca aaa aga acg ate aaa ata ecc I96a 
Glu Asp Thr Glu Thr He Lys Asn Thr Lys A^g Th? He lyl Val Pro 
^45 650 655 

Hi« tit w^? ""^^ ^^"^ 9^9 tta eag 2016 

His Ser Val Asp Cys Leu Gin Gly He Leu Ser Val He Pro Leu Gin 
660 665 670 

llf. flf. f?^ 11"" Z^"" ""^^ ggc tat gat gtt gat tte 2064 " 

Leu Leu Ala Phe Hxs Leu Ala Val Leu Arg Gly Tyr Asp Val Asp Phe 
675 680 685 

cea egg aat ctt gee aaa tet gtg act gta gag tga 2100 
Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 
690 695 

<210> 6 

<211> 699 

<212> PRT 

<213> Homo sapiens 

<220> 

* <221> Tnisc_f eature 

<222> (57)., (57) 

<223> Le 'Xaa' en position 57 repr^sente Thr ou He. 

<400> 6 ; 

Met Cys Gly He Phe Ala Tyr Leu Asn Tyr His Val Pro Arg Thr Arg 
5 10 



15 



Arg Glu He Leu Glu Thr Leu He Lys Gly Leu Gin Arg Leu Glu Tyr 
20 25 30 

Arg Gly Tyr Asp Ser Ala Gly Val Gly Phe Asp Gly Gly Asn Asp Lys 
35 40 45 

Asp Trp Glu Ala Asn Ala Cys Lys Xaa Gin Leu He Lys Lys Lys Glv 
50 55 60 



Lys Val Lys Ala Leu Asp Glu Glu Val His Lys Gin Gin Asp Met Asp 

70 75 80 
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Leu Asp lie Qlu Phe Asp Val His Leu Qly He Ala His Thr Arg Trp 
85 90 95 

Ala Thr His Gly Glu Pro Ser Pro Val Asn Ser His Pro Gin Arg Ser 
100 105 110 

Asp Lys Asn Asn Glu Phe He Val He His Asn Gly He He Thr Asn 
115 120 125 

Tyr Lys Asp Leu Lys Lys Phe Leu Glu Ser Lys Gly Tyr Asp Phe Qlu 
130 135 

Ser Glu Thr Asp Thr Glu Thr He Ala Lys Leu Val Lys Tyr Met Tyr 

150 155 160 

Asp Asn Arg Glu Ser Gin Asp Thr Ser Phe Thr Thr Leu Val Qlu Arg 
165 170 175 

Val He Gin Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys Ser Val 
180 185 190 

His Phe Pro Gly Qln Ala Val Qly Thr Arg Arg Gly Ser Pro Leu Leu 
195 200 205 

He Gly val Arg Ser Qlu His Lys Leu Ser Thr Asp His He Pro He 
210 215 220 

Leu Tyr Arg Thr Ala Arg Thr Qln He Gly Ser Lys Phe Thr Arg Trp 

230 235 240 

Gly Ser Gin Gly Glu Arg Gly Lys Asp Lys Lys Gly Ser Cys Asn Leu 
245 250 255 

f 

Ser Arg Val Asp Ser Thr Thr Cys Leu Phe Pro Val Glu Glu Lys Ala 
260 265 270 

Val Glu Tyr Tyr Phe Ala Ser Asp Ala Ser Ala Val He Glu His Thr 
275 280 285 

^? ^^■^ Asp Asp Val Ala Ala Val Val Asp 

290 295 300 

Gly Arg Leu Ser He His Arg He Lys Arg Thr Ala Gly Asp His Pro 

310 315 320 

Gly Arg Ala Val Gin Thr Leu Qln Met Qlu Leu Gin Gin He Met Lys 
325 330 335 
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Gly Asn Phe Ser Ser Phe Met Qln Lys Glu He Phe Glu Gin Pro Glu 
340 345 350 

Ser Val Val Asn Thr Met Arg Gly Arg Val Asn Phe Asp Asp Tyr Thr 
355 360 365 

Val Asn Leu Gly Gly Leu Lys Asp His He Lys Glu He Gin Arg Cys 
370 375 380 

Arg Arg Leu He Leu He Ala Cys Gly Thr Ser Tyr His Ala Gly Val 

390 395 4QQ 

Ala Thr Arg Gin Val Leu Glu Glu Leu Thr Glu Leu Pro Val Met Val 
405 410 415 

Glu Leu Ala Ser Asp Phe Leu Asp Arg Asn Thr Pro Val Phe Arg Asp 
420 425 430 

Asp Val Cys Phe Phe Leu Ser Gin Ser Gly Glu Thr Ala Asp Thr Leu 
435 440 445 

Met Gly Leu Arg Tyr Cys Lys Glu Arg Gly Ala Leu Thr Val Gly He 
450 455 460 

Thr Asn Thr Val Gly Ser Ser He Ser Arg Glu Thr Asp Cys Gly Val 
465 470 475 

His He Asn Ala Gly Pro Glu He Gly Val Ala Ser Thr Lys Ala Tyr 
485 490 495 

Thr Ser Gin Phe Val Ser Leu Val Met Phe Ala Leu Met Met Cys Asp 
500 505 510 

Asp Arg He Ser Met Gin Glu Arg Arg Lys Glu He Met Leu Gly * Leu 
515 520 525 

Lys Arg Leu Pro Asp Leu He Lys Glu Val Leu Ser Met Asp Asp Glu 
530 535 54Q 

He Gin Lys Leu Ala Thr Glu Leu Tyr His Gin Lys Ser Val Leu He 

550 555 560 

Met Gly Arg Gly Tyr His Tyr Ala Thr Cys Leu Glu Gly Ala Leu Lys 
565 570 575 

He Lys Glu He Thr Tyr Met His Ser Glu Gly He Leu Ala Gly Glu 
580 585 590 
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Leu Lys His Gly Pro Leu Ala Leu Val Asp Lys Leu Met Pro Val He 
595 600 605 

Met He He Met Arg Asp His Thr Tyr Ala Lys Cys Gin Asn Ala Leu 
610 615 620 

Gin Gin Val Val Ala Arg Gin Gly Arg Pro Val Val He Cys Asp Lys 

«30 635 640 

Glu Asp Thr Glu Thr He Lys Asn Thr Lys Arg Thr He Lys Val Pro 
645 650 655 

His Ser Val Asp Cys Leu Gin Gly He Leu Ser Val He Pro Leu Gin 
660 665 670 

Leu Leu Ala Phe His Leu Ala Val Leu Arg Gly Tyr Asp Val Asp Phe 
675 680 685 

Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 
690 695 



<210> 


7 


<211> 


2064 


<212> 


ADN 


<213> 


Sequence artificielle 


<220> 




<223> 


GPATl modif i^e par \ine 


<220> 




<221> 


CDS 


<222> 


(1) . . (2064) 


<223> 


<220> 




<221> 


misc feature 


<222> 


(170) . . (170) 


<223> 


t ou c 


<400> 


7 



atg tgt ggt ata ttt get tac tta aac tac cat gtt cct cga acg aga 48 
Met Cys Gly He Phe Ala Tyr Leu Asn Tyr His Val Pro Arg Thr Arg 
•^5 10 15 

cga gaa ate ctg gag acc eta ate aaa ggc ctt cag aga ctg gag tac 96 
Arg Glu He Leu Glu Thr Leu He Lys Gly Leu Gin Arg Leu Glu Tyr 
20 2S 30 

It^ f^*" gga gge aat gat aaa 144 

Arg Gly Tyr Asp Ser Ala Gly Val Gly Phe Asp Gly Gly Asn Asp Lya 
35 40 45 

gat tgg gaa gee aat gee tgc aaa anc cag ctt att aag aag aaa gga 192 
Asp Trp Glu Ala Asn Ala Cys Lys Xaa Gin Leu He Lys Lys Lys Glv 
50 55 60 

aaa gtt aag gea etg gat gaa gaa gtt cac aag caa caa gat atg gat 240 
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Hl« fo« HP ^^^^ ^"^^ atg gaa etc cag 

His Asp His Pro Gly Arg Ala Val Gin Thr Leu Gin Met Glu Leu Gin 

310 315 320 

t^f ^^"^ ^^^t atg cag aag gaa ata ttt 

Gin lie Met Lys Gly Asn Phe Ser Ser Phe Met Gin Lys Glu He Phe 



288 



336 



384 



432 



480 



- 19 - 

Lys Val Lys Ala Leu Asp Glu Glu Val His Lys Gin Gin Asp Met Asp 

■'O 75 80 

ttg gat ata gaa ttt gat gta cac ctt gga ata get cat acc cgt tgg 
Leu Asp He Glu Phe Asp Val His Leu Gly He Ala His Thr Arg 
85 90 

gca aca cat gga gaa cce agt cct gtc aat age cac ccc cag cgc tct 
Ala Thr Hxs Gly Glu Pro Ser Pro Val Asn Ser His Pro Gil A^g Ser 
100 105 110 ^ 

gat aaa aat aat gaa ttt ate gtt att cac aat gga ate ate aec aac 
Asp Lys Asn Asn Glu Phe He Val He His Asn Gly He He Thr Asn 
115 120 125 

tac aaa gac ttg aaa aag ttt ttg gaa age aaa ggc tat gac ttc gaa 
Tyr Lys Asp Leu Lys Lys Phe Leu Glu Ser Lys Gly Tyr Lp Phe Glu 
•"•30 135 j^^Q 

^"^^ etc gtt aag tat atg tat 

Ser Glu Thr Asp Thr Glu Thr He Ala Lys Leu Val LyI Tyr Mel T^r 

150 155 j^gO 

gac aat egg gaa agt caa gat acc age ttt act aec ttg gtg gag aqa B28 
Asp Asn Arg Glu Ser Gin Asp Thr Ser Phe Thr Thr Leu Val Gl? A?5 
165 170 175 

gtt ate caa caa ttg gaa ggt get ttt gca ott gtg ttt aaa agt gtt 57s 
Val He Gin Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys slr Val 
180 185 190 

Z^^ caa gca gtt gge aca agg cga ggt age cct ctq tta 624 

HXS Phe Pro Gly Gin Ala Val Gly Thr Ari Alg Gly sir P?o III iZ * 
195 200 205 

att ggt gta egg agt gaa cat aaa ctt tct act gat cac att cct ata 
He Gly Val Arg Ser Glu His Lys Leu Ser Thr Asp His He Pro He 
210 215 220 

etc tac aga aca ggc aaa gac aag aaa gga age tge aat etc tct CQt 
Leu Tyr Arg Thr Gly Lys Asp Lys Lys Gly Ser Cys Asn Leu Ser J^g 

230 235 240 

tl^ l^"" tZ^ Sv*" ^^'^ ^^"^ 9aa aaa gca gtg gag 768 

Val Asp Ser Thr Thr Cys Leu Phe Pro Val Glu Glu Lys Ala Val Glu 
245 250 255 >' 

tat tac ttt get tct gat gca agt get gtc ata gaa cac aec aat cac 
Tyr Tyr Phe Ala Ser Asp Ala Ser Ala Val He llu His ^ ^n Sg 
260 265 270 

vl^ T^l 11^ I?* 9ca gca gta gtg gat gga cgt 

Val He Phe Leu Glu Asp Asp Asp Val Ala Ala Val Val Isp Gly A^g 
275 280 285 

L^S III S^*" ^""^ 99* *=*t cac cat cac cat 

Leu Ser He His Arg He Lys Arg Thr Ala Gly His His His His His 

295 300 



672 



720 



816 



864 



912 



960 



1008 
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32S 330 335 

gag cag cca gag tct gtc gtg aac aca atg aga gga aaa ate aae tfc«- im^c 
Glu Qln Pro Glu ser Val Val Asn Thr Mel ftlg Gly t?g VaJ Asn p£e 

345 350 

gat gac tat act gtg aat ttg ggt ggt ttg aag gat cac ata aag gag 1104 
Asp ASP Tyr Thr Val Asn Leu Qly Gly Leu Lys Asp His lie Lyf Glu 
355 360 365 

ato cag aga tgc egg cgt ttg att ctt att get tgt gga aca agt tac 1152 
He Gin Arg Cys Arg Arg Leu He Leu He Ala C?s Sly Thr sir ij? 
370 375 3QQ 

H?^ ""^^ «=tt gag gag ctg act gag ttg 1200 

His Ala Gly Val Ala Thr Arg Gin Val Leu Glu Glu Leu Thr Ql2 £eS 

390 395 

cct gtg atg gtg gaa eta gca agt gac ttc ctg gac aga aac aca cca 124 8 

Pro Val Met Val Glu Leu Ala Ser Asp Phe Leu Lp A?g AsS ?ro 
405 410 415 

9^*^ ^9° ttc ctt agt caa tea ggt gaq aca 1296 

Val Phe Arg Asp Asp Val Cys Phe Phe Leu sir Gin Ser Gly %ll ?S? 
420 425 430 

f?^ t^*= aag gag aga gga get tta 1344 

Ala Asp Thr Leu Met Gly Leu Arg Tyr Cys Lyl 111 jjg |fy Lei 
435 440 445 

f^i 9tt ggc agt tec ata tea egg gag aca 1392 

Thr Val Gly He Thr Asn Thr Val Gly Ser Ser He Ser Ar| Glu Thr 

*50 455 

"t*" Sr^t 99^^ gag att ggt gtg gee agt 1440 

Asp cys Gly val His He Asn Ala Gly Pro Glu He Gly Val Ila sir 

470 475 480 

aca aag get tat ace age cag ttt gta tec ctt gtg atg ttt gcc ctt 14 a a 

Thr Lys Ala Tyr Thr Ser Gin Phe Val Ser Leu ?al Met Phe ?S1 Leu 



485 490 



495 



M«? tlf ^^^9 caa gaa aga cgc aaa gag ate 1535 

Met Met Cys Asp Asp Arg He Ser Met Gin Glu A?g Arg Lys Glu He 
500 505 



510 



M^H ? H?^ °9g ctg cct gat ttg att aag gaa gta ctg age 

Met Leu Qly Leu Lys Arg Leu Pro Asp Leu He Lyi Glu ?al LeS sir 
515 520 



525 



540 



s^^ frl^ 9gc tat eat tat get act tgt ctt gaa 

Ser Val Leu He Met Gly Arg Gly Tyr His Tyr Ala Thr C?s Leu Glu 

550 555 ggO 



575 



t1» f? H?*" 9gc cct Ctg get ttg gtg gat aaa ttg 

Leu Ala Gly Glu Leu Lys Hie Gly Pro Leu Ala Leu Val Lp lyt Lei 
580 585 590 



1584 



atg gat gae gaa att cag aaa eta gca aca gaa ctt tat cat caa aaa 16^9 
Met Asp Asp Glu He Qln Lys Leu Ala Thr llu Leu Tyr Sis III lJI 

530 535 



1680 



ggg gca ctg aaa ate aaa gaa att act tat atg cac tct gaa aac ate 1728 
Gly Ala Leu Lys He Lys Glu He Thr Tyr MeE His Ser llu %ly He 
565 570 



1776 
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atg cct gtg ate atg ate ate atg aga gat cac act tat gcc aag tgt 1824 
Met Pro Val He Met He He Met Arg Asp His Thr Tyr Ala Lys Cys 
595 600 605 

cag aat get ctt cag eaa gtg gtt get egg cag ggg egg cct gtg gta 1872 
Gin Asn Ala Leu Gin Gin Val Val Ala Arg Gin Gly Arg Pro Val Val 
SIO 615 620 

att tgt gat aag gag gat aet gag aee att aag aae aea aaa aga aeg 1920 
He Cys Asp Lys Glu Asp Thr Glu Thr He Lys Asn Thr Lys Arc? Thr 
^25 630 635 640 

ate aag gtg eee cae tea gtg gae tge ttg cag ggc att etc age gtg 1968 
He Lys Val Pro His Ser Val Asp Cys Leu Gin Gly He Leu Ser Val 
645 650 655 

ate cct tta cag ttg ctg get tte eae ctt get gtg ctg aga gge tat 2016 
lie Pro Leu Gin Leu Leu Ala Phe His Leu Ala Val Leu Ara Glv Tvr 
660 665 670 



gat gtt gat tte cea egg aat ctt gee aaa tet gtg aet gta gag tga 
Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 
675 680 685 

<210> 8 
<211> 687 
<212> PRT 

<213> Sequence artificielle 
<220> 

< 2 2 1 > mi s e_f ea ture 
<222> (57).. (57) 

<223> Le »Xaa" en position 57 repr^sente Thr ou He. 
<220> 

<223> GFATl modifi^e par une etiquette de purification interne 
<400> 8 

Met Cys Gly He Phe Ala Tyr Leu Asn Tyr His Val Pro Arg Thr Arg 
^ 5 10 15 

Arg Glu He Leu Glu Thr Leu He Lys Gly Leu Gin Arg Leu Glu Wr 
20 25 30 

Arg Gly Tyr Asp Ser Ala Gly Val Gly Phe Asp Gly Gly Asn Asp Lys 
35 40 45 

Asp Trp Glu Ala Asn Ala Cys Lys Xaa Gin Leu He Lys Lys Lys Glv 
50 55 60 

Lys Val Lys Ala Leu Asp Glu Glu Val His Lys Gin Gin Asp Met Asp 
" 70 75 80 

Leu Asp He Glu Phe Asp Val His Leu Gly He Ala His Thr Arg Trp 
85 90 95 



2064 
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Ala Thr His Gly Glu Pro Ser Pro Val Asn Ser His Pro Gin Arg Ser 
100 105 110 

Asp Lys Asn Asn Glu Phe He Val He His Asn Gly He He Thr Asn 
115 120 125 

Tyr Lys Asp Leu Lys Lys Phe Leu Glu Ser Lys Gly Tyr Asp Phe Glu 
130 135 140 

Ser Glu Thr Asp Thr Glu Thr He Ala Lys Leu Val Lys Tyr Met Tvr 

150 155 160 

Asp Asn Arg Glu Ser Gin Asp Thr Ser Phe Thr Thr Leu Val Glu Arg 
165 170 175 

Val He Gin Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys Ser Val 
180 185 190 

His Phe Pro Gly Gin Ala Val Gly Thr Arg Arg Gly Ser Pro Leu Leu 
195 200 205 

He Gly Val Arg Ser Glu His Lys Leu Ser Thr Asp His He Pro He 
210 215 220 

Leu Tyr Arg Thr Gly Lys Asp Lys Lys Gly Ser Cys Asn Leu Ser Arg 

230 235 240 

Val Asp Ser Thr Thr Cys Leu Phe Pro Val Glu Glu Lys Ala Val Glu 
24S 250 255 

Tyr Tyr Phe Ala Ser Asp Ala Ser Ala Val He Glu His Thr Asn Arc? 
260 265 270 

Val He Phe Leu Glu Asp Asp Asp Val Ala Ala Val Val Asp Gly Arg 
275 280 285 < 

Leu Ser He His Arg He Lys Arg Thr Ala Gly His His His His His 
290 295 300 

His Asp His Pro Gly Arg Ala Val Gin Thr Leu Gin Met Glu Leu Gin 

310 315 320 

Gin He Met Lys Gly Asn Phe Ser Ser Phe Met Gin Lys Glu He Phe 
325 330 335 

Glu Gin Pro Glu Ser Val Val Asn Thr Met Arg Gly Arg Val Asn Phe 
340 345 350 



Asp Asp Tyr Thr Val Asn Leu Gly Gly Leu Lys Asp His He Lys Glu 
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360 
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365 



lie Gin Arg Cys Arg Arg Leu lie Leu lie Ala Cys Gly Thr Ser Tvr 
370 375 380 

His Ala Qly Val Ala Thr Arg Gin Val Leu Glu Glu Leu Thr Glu Leu 

390 395 400 

Pro Val Met Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Asn Thr Pro 
405 410 415 

Val Phe Arg Asp Asp Val Cys Phe Phe Leu Ser Gin Ser Gly Glu Thr 
420 425 430 



Ala Asp Thr Leu Met Gly Leu Arg Tyr Cys Lys Glu Arg Gly Ala Leu 
435 440 



445 



Thr Val Gly lie Thr Asn Thr Val Gly Ser Ser lie Ser Arg Glu Thr 
450 455 460 

Asp Cys Gly Val His lie Asn Ala Gly Pro Glu lie Gly Val Ala Ser 

470 475 4g0 

Thr Lys Ala Tyr Thr Ser Gin Phe Val Ser Leu Val Met Phe Ala Leu 
485 490 495 

Met Met Cys Asp Asp Arg He Ser Met Gin Glu Arg Arg Lys Glu He 
500 505 510 

Met Leu Gly Leu Lys Arg Leu Pro Asp Leu He Lys Glu Val Leu Ser 
515 520 525 



Asp Glu He Gin Lys Leu Ala Thr Glu Leu Tyr His Gin Lys 



535 



540 



Ser Val Leu He Met Gly Arg Gly Tyr His Tyr Ala Thr Cys Leu Glu 



550 



555 



560 



Gly Ala Leu Lys He Lys Glu He Thr Tyr Met His Ser Glu Gly He 



565 



570 



575 



Leu Ala Qly Glu Leu Lys His Gly Pro Leu Ala Leu Val Asp Lys Leu 



580 



585 



590 



Met Pro Val He Met He He Met Arg Asp His Thr Tyr Ala Lys Cys 

595 ^ rs. ^ 



600 



605 



Gin Asn Ala Leu Gin Gin Val Val Ala Arg Gin Gly Arg Pro Val Val 

615 620 
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lie Cys Asp Lys Glu Asp Thr Glu Thr lie Lys Asn Thr Lys Arg Thr 
625 630 635 640 

He Lys Val Pro His Ser Val Asp Cys Leu Gin Gly He Leu Ser Val 
645 650 655 

He Pro Leu Gin Leu Leu Ala Phe His Leu Ala Val Leu Arg Gly Tvx 
660 665 670 

Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 
675 680 685 

<210> 9 
<211> 2067 
<212> ADN 

<213> Sequence artificielle 
<220> 

<22 3> GPAT2 modifi^e par une Etiquette de purification interne 

<220> 

<221> CDS 

<222> (1)..(2067) 

<223> 

<400> 9 

atg tgc gga ate ttt gcc tac atg aac tac aga gtc ccc egg acg acfcr 4 8 

Met Cys Gly He Phe Ala Tyr Met Asn Tyr Arg Val Pro Arg Th? Arg 

^ 5 10 15 * 

aag gag ate ttc gaa acc etc ate aag gge etg cag egg etg gag tac 96 
Lys Glu He Phe Glu Thr Leu He Lys Gly Leu Gin Arg Leu Glu Tyr 
20 25 30 

2?^ ^"^^ Srgg aat aat cae gaa 144 

Arg Gly Tyr Asp Ser Ala Gly Val Ala He Asp Gly Asn Asn His Glu 
35 40 45 



192 



240 



f^i f H?^ ""^"^ ""^^ ""^S ^^Sr aaa agg ggg aaa gtc aag 

Val Lys Glu Arg His He Gin Leu Val Lys Lys Arg Gly Lys Val^Lys 
SO 55 60 

get etc gat gaa gaa ett tac aaa eaa gae age atg gae tta aaa gtg 
Ala Leu Asp Glu Glu Leu Tyr Lys Gin Asp Ser Met Asp Leu Lys Val 
" 70 75 80 

gag ttt gag aea eac tte gge att gee eae acg egc tgg gee ace eac 288 
Glu Phe Glu Thr His Phe Gly He Ala His Thr Arg Trp Ala Thr His 
85 90 95 

ggg gtc ccc agt get gtc aac age eac cct cag egc tea gae aaa gge 
Gly Val Pro Ser Ala Val Asn Ser His Pro Gin Arg Ser Asp Lys Glv 
100 105 110 

aac gaa ttt gtt gtc ate eae aat ggg ate ate aea aat tac aaa gat 
Asn Glu Phe Val Val He His Asn Gly He He Thr Asn Tyr Lys Asp 
115 120 125 

etg agg aaa ttt etg gaa age aaa gge tac gag ttt gag tea gaa aca 432 



336 



384 
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»320 



325 330 



335 



380 



528 



576 



- 25 - 

Leu Arg Lys Phe Leu Glu Ser Lys Gly Tyr Glu Phe Qlu Ser Glu Thr 
130 135 140 

gat aca gag acc ate gcc aag ctg att aaa tat c?tq ttc aac aac aa» nan 
ASP Thr Glu Thr lie Ala Lys LeS He Lys Tyr ?al Phi Sp l^n ^ "° 

3.50 155 3^g^ 

gaa act gag gac att acg ttt tea aeg ttg gte gag aqa ate att cao 
Qlu Thr Glu ASP He Thr Phe Ser ThI LeS ?al IS ?al He SS 
165 170 175 

cag ttg gaa ggt gea ttc gcg ctg gtt ttc aag agt gte eae tac cca 
Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys Ser Val His Tyr pS 
180 185 190 

gga gaa gcc gtt gee aca egg aga ggc age cec ctg etc ate gga gte fi24 
Gly Glu Ala Val Ala Thr Arg Arg Gly Ser Pro LeS Leu He %ly vll 
"5 200 205 

III IIZ ate cct ate tta tac agg 

Arg ser Lys Tyr Lys Leu Ser Thr Glu Gin He Pro He Leu Tyr 
210 215 220 

acg tgc act ctg gag aat gtg aag aat ate tgt aag aca egg atg aaa 
Thr Cys Thr Leu Glu Asn Val Lys Asn He C?s LyI Thr S| Set lyl 

230 235 240 

agg ctg gac age tec gcc tgc ctg cat get gtg ggc gac aag gee gta 
Arg Leu Asp Ser Ser Ala Cys Leu His Ala Val Gly ISp lJI Sa ?al 
245 250 255 

rt,^ III 9at gea age get ate ata gag cac acc aac 

Glu Phe Phe Phe Ala Ser Asp Ala Ser Ala He He Glu His Thr Asn 
260 265 270 

11^ ?r^? ^^"^ 9^*^ 9*° ate 9CC gea gtg get gat ggg 

Arg Val He Phe Leu Glu Asp Asp Asp He Ala Ala Val Ila Sp lly 
275 280 285 

aaa etc tec att cac egg gte aag cgc teg gee agt cat cac cat cac 
Lys Leu ser He His Arg Val Lys A?g Se? Ila sir Ss His His 5is 
290 295 300 



672 



720 



768 



816 



864 



912 



cat cac gat gac cca tct cga gcc ate cag acc ttg cag atg gaa eta 960 
Hxs Hxs Asp Asp Pro Ser Arg Ala He Gil Thr Le? Gl? Se? IS ^e? 



cag caa ate atg aaa ggt aac ttc agt gcg ttt atg cag aag gag ate 1008 
Gin Gin He Met Lys Gly Asn Phe Ser Ala Phe Met Gl? LyI IS ?le 



Hf* °f9 cca gaa tea gtt ttc aat act atg aga ggt egg gtg aat 
Phe Glu Gin Pro Glu Ser Val Phe Asn Thr Mel A?g lly S| ?a! Jan 
340 345 350 

III ^° 9tg etc ctg ggt ggc ttg aag gac cac ttg aag 

Phe Glu Thr Asn Thr Val Leu Leu Gly Gly Leu Lys Asp His Leu LyI 
355 360 365 

llS rlt 11^ f9a egg etc ate gtg att ggc tgt gga acc age 1152 

Glu He Arg Arg Cys Arg Arg Leu He Val He Gly Cys Gly Thr Ser 



1056 



1104 



370 375 

tJ? Hf« f?" f?"" fr^^ egg caa gtt ttg gag gaa ctg act gag 1200 

Tyr His Ala Ala Val Ala Thr Arg Gin Val Leu Glu Glu LeS Thr Glu 
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390 395 400 

ctt cct gtg atg gtt gaa ctt get agt gat ttt ctg gac agg aac aca 1248 
Leu Pro Val Met Val Qlu Leu Ala Ser Asp Phe LeS Asp Ai| Asn Thr 
405 4X0 415 

H*^? ''9° *^tc age cag tea gge gag 1296 

Pro Val Phe Arg Asp Asp Val Cya Phe Phe lie Ser Gin Ser Gly Glu 
420 425 430 

aoc gcg gae ace etc etg geg ctg ege tae tgt aag gac cgc gge get 1344 
Thr Ala Asp Thr Leu Leu Ala Leu Arg Tyr Cys Lys Asp Arg Gly Ala 
435 440 445 

etc acc gtg gge gtc ace aac ace gtg gge age tec ate tot egc gag 1392 
Leu Thr Val Gly Val Thr Asn Thr Val Gly Ser Ser He Ser A?g III 
450 455 460 

acc gac tgc gge gtc cao ate aac gca ggg ccg gag gtc gge gtq qce 1440 
Thr Asp Cys Gly Val His He Asn Ala 61? Pro Glu Val Gly ?al Ala 

470 475 480 

age acc aag get tat acc agt cag ttc ate tct etg gtg atg ttt got 1488 
Ser Thr Lys Ala Tyr Thr Ser Gin Phe He Ser Leu Val Me? Phe 111 
485 490 495 

T*"^ t^f t^? ^"^^ ^ac cga att tea eta caa aac agg agg caa gag 1536 
Leu Met Met Ser Glu Asp Arg He Ser Leu Gin Asn Arg aI| Gin III 
500 505 510 

gag ctg ate aag gaa gtg ctg 1584 
He He Arg Gly Leu Arg Ser Leu Pro Glu Leu He Lys Glu Val Leu 
515 520 525 

tct ctg gag gag aag ate cac gac ttg gee ctg gag etc tac aeg cag 1632 
ser Leu Glu Glu Lys He His Asp Leu Ala LeS GlS Leu Tyr Thr III 

530 535 g^Q 

aga teg ctg ctg gtg atg ggg egg gge tac aac tat gee ace tgc ctg 1680 
^g ser Leu Leu Val Met Gly Arg Gly Tyr Asn Tyr Ila Thr C?s Le? 

550 555 5g0 

gaa gga gee etg aaa att aaa gag ata ace tae atg cae tea gaa gge 1728 
Glu Gly Ala Leu Lys He Lys Glu He Thr Tyr Met His Ser llu lly 
565 570 575 ^ 

Til rlf, fi^ 2?^ tf^ f*'9 aag cae ggg eee ctg gca ctg att gac aag 1776 
He Leu Ala Gly Glu Leu Lys His Gly Pro Leu Ala Leu He Asp Lys 
580 585 590 

rt« m!? 9tc ate atg gtc att atg aag gat cct tgc ttc gee aaa 1824 

Gin Met Pro Val He Met Val He Met Lys Asp Pro Cys Phe Ala Lys 
595 600 605 

ri« l^"" f^"" ^f9 caa gtc aeg gee cgc cag ggt egc ccc att 1872 

Cys Gin Asn Ala Leu Gin Gin Val Thr Ala Arg Gin Gly Arg Pro He 
SIO 615 620 

r^l f^^ 19C tec aag gac gat act gaa agt tec aag ttt gcg tat aag 1920 
He Leu Cys Ser Lys Asp Asp Thr Glu Ser Ser Lys Phe Ala Tyr Lys 

630 635 640 

Sf^ ^*^9 ccc cae act gtg gac tgc etc cag gge ate ctg age 1968 
Thr He Glu Leu Pro His Thr Val Asp Cys Leu Gin Gly He Leu Ser 
645 650 655 
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S*"? ctg get gtt etc cga gga 2016 

Val lie Pro Leu Gin Leu Leu Ser Phe His Leu Ala Val Leu Ara Glv 
660 665 670 

tat gac gtt gac ttc ccc aga aat ctg gcc aag tct gta act gtg gaa 2064 

Tyr Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 
675 680 685 



tga 

<210> 10 
<211> 688 
<212> PRT 

<213> Sequence artificielle 
<220> 

<223> GFAT2 modifi€e par une Etiquette de purification interne 
<400> 10 

Met Cys Gly lie Phe Ala Tyr Met Asn Tyr Arg Val Pro Arg Thr Arg 
^5 10 15 

Lys Glu He Phe Glu Thr Leu He Lys Gly Leu Gin Arg Leu Glu Tyr 
20 25 30 

Arg Gly Tyr Asp Ser Ala Gly Val Ala He Asp Gly Asn Asn His Glu 
35 40 45 

Val Lys Glu Arg His He Gin Leu Val Lys Lys Arg Gly Lys Val Lys 
50 55 60 

Ala Leu Asp Glu Glu Leu Tyr Lys Gin Asp Ser Met Asp Leu Lys Val 

70 75 80 

Glu Phe Glu Thr His Phe Gly He Ala His Thr Arg Trp Ala Thr His 
85 90 95 

{ 

Gly Val Pro Ser Ala Val Asn Ser His Pro Gin Arg Ser Asp Lvs Glv 
100 105 110 

Asn Glu Phe Val Val He His Asn Gly He He Thr Asn Tyr Lys Asp 
115 120 125 

Leu Arg Lys Phe Leu Glu Ser Lys Gly Tyr Glu Phe Glu Ser Glu Thr 
130 135 140 

Asp Thr Glu Thr He Ala Lys Leu He Lys Tyr Val Phe Asp Asn Arg 

150 155 160 

Glu Thr Glu Asp He Thr Phe Ser Thr Leu Val Glu Arg Val He Gin 
165 170 175 



2067 
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Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys Ser Val His Tyr Pro 
180 185 190 

Gly Qlu Ala Val Ala Thr Arg Arg Gly Ser Pro Leu Leu lie Gly Val 
195 200 205 

Arg ser Lys Tyr Lys Leu Ser Thr Qlu Gin lie Pro lie Leu Tyr Arq 
210 215 220 

Thr Cys Thr Leu Glu Asm Val Lys Asn He Cys Lys Thr Arg Met Lys 

230 235 240 

Arg Leu Asp Ser Ser Ala Cys Leu His Ala Val Gly Asp Lys Ala Val 
245 250 255 

Glu Phe Phe Phe Ala Ser Asp Ala Ser. Ala He He Glu His Thr Asn 
260 265 270 

Arg Val He Phe Leu Glu Asp Asp Asp He Ala Ala Val Ala Asp Gly 
275 280 285 

Lys Leu Ser He His Arg Val Lys Arg Ser Ala Ser His His His His 
290 295 300 

His His Asp Asp Pro Ser Arg Ala He Gin Thr Leu Gin Met Glu Leu 

310 315 320 

Qln Gin He Met Lys Gly Asn Phe Ser Ala Phe Met Gin Lys Glu He 
325 330 335 

Phe Glu Gin Pro Glu Ser Val Phe Asn Thr Met Arg Gly Arg Val Asn 
340 345 35Q 

Phe Glu Thr Asn Thr Val Leu Leu Gly Gly Leu Lys Asp His Leu '-Lys 
355 360 365 

Glu He Arg Arg Cys Arg Arg Leu He Val He Gly Cys Gly Thr Ser 
370 375 

Tyr His Ala Ala Val Ala Thr Arg Gin Val Leu Glu Glu Leu Thr Glu 

390 395 400 

Leu Pro Val Met Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Asn Thr 
405 410 415 

Pro Val Phe Arg Asp Asp Val Cys Phe Phe He Ser Gin Ser Gly Glu 
420 425 430 
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Thr Ala Asp Thr Leu Leu Ala Leu Arg Tyr Cys Lys Asp Arg Gly Ala 
435 440 445 

Leu Thr Val Gly Val Thr Asn Thr Val Gly Ser Ser He Ser Arg Glu 
450 • 455 460 

Thr Asp Cys Gly Val His He Asn Ala Gly Pro Glu Val Gly Val Ala 
4^5 470 475 480 

Ser Thr Lys Ala Tyr Thr Ser Gin Phe He Ser Leu Val Met Phe Gly 
485 490 495 

Leu Met Met Ser Glu Asp Arg He Ser Leu Gin Asn Arg Arg Gin Glu 
500 505 510 

He He Arg Gly Leu Arg Ser Leu Pro Glu Leu He Lys Glu Val Leu 
515 520 525 

Ser Leu. Glu Glu Lys He His Asp Leu Ala Leu Glu Leu Tyr Thr Gin 
530 535 540 

Arg Ser Leu Leu Val Met Gly Arg Gly Tyr Asn Tyr Ala Thr Cys Leu 
545 550 555 560 

Glu Gly Ala Leu Lys He Lys Glu He Thr Tyr Met His Ser Glu Gly 
565 570 575 

He Leu Ala Gly Glu Leu Lys His Gly Pro Leu Ala Leu He Asp Lys 
580 585 590 

Gin Met Pro Val He Met Val He Met Lys Asp Pro Cys Phe Ala Lys 
595 600 605 

Cys Gin Asn Ala Leu Gin Gin Val Thr Ala Arg Gin Gly Arg Pro He 
610 615 620 { 

He Leu Cys Ser Lys Asp Asp Thr Glu Ser Ser Lys Phe Ala Tyr Lvs 
^25 630 635 640 

Thr He Glu Leu Pro His Thr Val Asp Cys Leu Gin Gly He Leu Ser 
645 650 655 

Val He Pro Leu Gin Leu Leu Ser Phe His Leu Ala Val Leu Arg Gly 
660 665 670 

Tyr Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 
675 680 685 



<210> 11 
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<211> 2118 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> GFATlAlt modifi€e par une etiquette de purification interne 

<220> 

<221> CDS 

<222> (1)_(2118) 

<223> 

<220> 

< 2 2 1 > mis c_f eat ur e 

<222> (170) . . (170) 

<223> t ou c 

<400> 11 

M^? ^f*" ^^"^ gtt cct cga acg aga 48 

Met Cys Gly He Phe Ala Tyr Leu Asn Tyx His Val Pro Aig ThI A?g 
^5 10 15 

cga gaa ate ctg gag acc eta ate aaa ggc ctt cag aga ctg gaa tac 96 
Arg Glu He Leu Glu Thr Leu He Lys Gly Leu Gil A^g Le? I?2 tJ? 
20 25 30 

It^ H?^ ^""^ 9Srt gtg gga ttt gat gga ggc aat gat aaa 144 

Arg Gly Tyr Asp Ser Ala Gly Val Gly Phe Asp Gly Gly Asn l^p lJs 
35 40 45 

Isn 1?,^ ttt ??f i^.! ff.^ ff9 Ctt att aag aag aaa gga 

60 



m ^ «7 "^^^ '^^^ att aag aag aaa gga 

Asp Trp Glu Ala Asn Ala Cys Lys Xaa Gin Leu He Lys Lys Lys Gly 
^° 55 60 

l5« f^^ «=aa gat atg gat 

Lys Val Lys Ala Leu Asp Glu Glu Val His Lys Gin Gin Asp Met Asp 

"^^ 75 eo 

ttg gat ata gaa ttt gat gta cac ctt gga ata get cat acc cert tac, 
Leu Asp He Glu Phe Asp Val His Leu Gly He lla His ?to Sg tS 
85 90 95 

f?^ ""^^ 3tc aat age cac ccc cag cgc tot 

Ala Thr His Gly Glu Pro Ser Pro Val Asn Ser His Pro Gil Sg Ser 
100 105 110 ? • 

III f^^ ^^"^ aat gga ate ate acc aac 

Asp Lys Asn Asn Glu Phe He Val He His Asn Gly He He Thr Asn 
lis 120 125 

tac aaa gac ttg aaa aag ttt ttg gaa age aaa ggc tat gac ttc gaa 
Tyr Lys Asp Leu Lys Lys Phe Leu Glu Ser Lys Gly Tyr Asp Phe Glu 
130 135 

III * 9fct aag tat atg tat 

Ser Glu Thr Asp Thr Glu Thr He Ala Lys Leu Val Lys Tyr Met Tyr 

150 155 160 

f«« ^f® caa gat acc age ttt act acc ttg gtg gag aga 

Asp Asn Arg Glu Ser Gin Asp Thr Ser Phe Thr Thr Leu Val Glu aIq 
165 170 175 

Va^ r^l get ttt gca ctt gtg ttt aaa agt gtt 576 

Val He Gin Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys Ser Val 



240 



288 



336 



384 



432 



480 



528 
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180 185 190 



cat ttt ccc ggg caa gca gtt ggc aca agg cga ggt age cct ctg ttg 
Has Phe Pro Gly Gin Ala Val Gly Thr Arg Arg Gly Ser Pro Leu Leu 
195 200 205 

att ggt gta egg agt gaa cat aaa ctt tct act gat cac att cct ata 
lie Gly Val Arg Ser Glu His Lys Leu Ser Thr Asp His lie Pro lie 
210 215 220 

etc tac aga aca get agg act eag att gga tea aaa tte aca egg tacr 
Leu Tyr Arg Thr Ala Arg Thr Gin He Gly Ser Lys Phe Thr Ara Tro 
225 230 ^ f 



235 240 



255 



tct cgt gtg gae age aca acc tgc ctt tte ceg gtg gaa gaa aaa gca 
Ser Arg Val Asp Ser Thr Thr Cys Leu Phe Pro Val Glu Glu Lys Ala 
260 265 



270 



624 



672 



720 



gga tea cag gga gaa aga ggc aaa gac aag aaa gga age tgc aat etc 768 
Gly Ser Gin Gly Glu Arg Gly Lys Asp Lys Lys Gly Ser Cys Asn Leu 
245 250 



816 



864 



960 



gtg gag tat tac ttt get tct gat gca agt get gtc ata gaa cac acc 
Val Glu Tyr Tyr Phe Ala Ser Asp Ala Ser Ala Val He Glu His Thr 
275 280 285 

aat cgc gtc ate ttt ctg gaa gat gat gat gtt gca gca gta gtg gat 912 
Asn Arg Val He Phe Leu Glu Asp Asp Asp Val Ala Ala Val Val Asp 
290 295 300 

gga cgt ctt tct ate cat cga att aaa cga act gca gga cat cac cat 
Gly Arg Leu Ser He His Arg He Lys Arg Thr Ala Gly His His His 

310 315 320 

cac cat cac gat cac ccc gga cga get gtg caa aca etc cag atg gaa 1008 
His His His Asp His Pro Gly Arg Ala Val Gin Thr Leu Gin Met Glu 
325 330 335 

etc cag cag ate atg aag ggc aac tte agt tea ttt atg eag aag gaa 1056 
Leu Gin Gin He Met Lys Gly Asn Phe Ser Ser Phe Met Gin Lys Glu 
340 345 350 

ata ttt gag eag cea gag tct gtc gtg aac aca atg aga gga aga gtc 1104 
He Phe Glu Gin Pro Glu Ser Val Val Asn Thr Met Arg Gly Arg Val 
355 360 365 

I 

It^ It^ it^^ 99*^ ttg aag gat cac ata 1152 

Asn Phe Asp Asp Tyr Thr Val Asn Leu Gly Gly Leu Lys Asp His He 
370 375 350 



1200 



1248 



aag gag ate cag aga tgc egg cgt ttg att ctt att get tgt gga aca 
Lys Glu lie Gin Arg Cys Arg Arg Leu He Leu He Ala Cys Gly Thr 

390 395 400 

agt tac cat get ggt gta gca aca cgt caa gtt ctt gag gag ctg act 
Ser Tyr His Ala Gly Val Ala Thr Arg Gin Val Leu Glu Glu Leu Thr 
405 410 415 

gag ttg cct gtg atg gtg gaa eta gca agt gac tte ctg gac aga aac 1296 
Glu Leu Pro Val Met Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Asn 
420 425 430 

aca cea gtc ttt cga gat gat gtt tgc ttt tte ctt agt caa tea ggt 1344 
Thr Pro Val Phe Arg Asp Asp Val Cys Phe Phe Leu Ser Gin Ser Glv 
435 440 445 
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530 535 540 

ctg age atg gat gac gaa att cag aaa eta gca aca gaa ctt tat cat 
Leu Ser Met Asp Asp Glu He Gin Lys Leu Ala Thr Glu Leu Tyr His 
545 550 555 560 

cag aag tea gtt ctg ata atg gga cga ggc tat cat tat get act tgt 
Gin Lys Ser Val Leu He Met Gly Arg Gly Tyr His Tyr Ala Thr Cys 
565 570 575 

ctt gaa ggg gca ctg aaa ate aaa gaa att act tat atg cac tct gaa 
Leu Glu Gly Ala Leu Lys He Lys Glu He Thr Tyr Met His Ser Glu 
580 585 590 



aag tgt cag aat get ott cag caa gtg gtt get egg cag ggg cgg^ cct 
Lys Cys Gin Asn Ala Leu Gin Gin Val Val Ala Arg Gin Gly Arg Pro 



625 630 635 



640 



1440 



1488 
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gag aca gca gat act ttg atg ggt ctt cgt tac tgt aag gag aga gga 1392 
Glu Thr Ala Asp Thr Leu Met Gly Leu Arg Tyr Cys Lys Glu Arg Gly 
450 455 460 

get tta act gtg ggg ate aca aac aca gtt ggc agt tec ata tea egg 
Ala Leu Thr Val Gly He Thr Asn Thr Val Gly Ser Ser He Ser Arg 
465 470 475 480 

gag aca gat tgt gga gtt cat att aat get ggt cct gag att ggt gtg 
Glu Thr Asp Cys Gly Val His He Asn Ala Gly Pro Glu He Gly Val 
485 490 495 

gee agt aca aag get tat ace age cag ttt gta tec ctt gtg atg ttt 1536 
Ala Ser Thr Lys Ala Tyr Thr Ser Gin Phe Val Ser Leu Val Met Phe 
500 505 510 

gee ctt atg atg tgt gat gat egg ate tec atg caa gaa aga cge aaa 1584 
Ala Leu Met Met Cys Asp Asp Arg He Ser Met Gin Glu Arg Arg Lys 
515 520 525 

gag ate atg ctt gga ttg aaa egg ctg cct gat ttg att aag gaa gta 1632 
Glu He Met Leu Gly Leu Lys Arg Leu Pro Asp Leu He Lys Glu Val 

Cn/\ f-«%p* ^ 



1680 



1728 



1776 



ggc ate ctt get ggt gaa ttg aaa cat ggc cct ctg get ttg gtg gat 1824 
Gly He Leu Ala Gly Glu Leu Lys His Gly Pro Leu Ala Leu Val Asp 
595 600 605 

aaa ttg atg cct gtg ate atg ate ate atg aga gat cac act tat gee 1872 
Lys Leu Met Pro Val He Met He He Met Arg Asp His Thr Tyr Ala 
610 615 620 



1920 



gtg gta att tgt gat aag gag gat act gag ace att aag aac aca aaa 1968 
val Val He Cys Asp Lys Glu Asp Thr Glu Thr He Lys Asn Thr Lys 
645 650 655 

9tg gac tgc ttg cag ggc att etc 2016 
Arg Thr He Lys Val Pro His Ser Val Asp Cys Leu Gin Gly He Leu 
660 665 670 

age gtg ate cct tta cag ttg ctg get ttc cac ctt get gtg ctg aga 2064 
Ser Val He Pro Leu Gin Leu Leu Ala Phe His Leu Ala Val Leu Arg 
675 680 685 

ggc tat gat gtt gat ttc cca egg aat ctt gee aaa tct gtg act gta 2112 
Gly Tyr Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val 
690 695 700 
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gag tga 

Glu 

705 



33 - 

2118 



<210> 12 

<211> 705 

<212> PRT 

<213> Sequence artificielle 
<220> 

< 2 2 1 > mi sc_f eature 

<222> (57) . . (57) 

<223> Le »Xaa' en position 57 repr^sente Thr ou lie. 
<220> 

<223> GPATlAlt modifiee par une Etiquette de purification interne 

<400> 12 

Met Cys Gly He Phe Ala Tyr Leu Asn Tyr His Val Pro Arg Thr Arg 
1 5 10 15 

Arg Glu He Leu Glu Thr Leu He Lys Gly Leu Gin Arg Leu Glu Tyr 
20 25 30 

Arg Gly Tyr Asp Ser Ala Gly Val Gly Phe Asp Gly Gly Asn Asp Lys 
35 40 45 

Asp Trp Glu Ala Asn Ala Cys Lys Xaa Gin Leu He Lys Lys Lys Gly 
^0 55 60 

Lys Val Lys Ala Leu Asp Glu Glu Val His Lys Gin Gin Asp Met Asp 

70 75 80 

Leu Asp He Glu Phe Asp Val His Leu Gly He Ala His Thr Arg Trp 
85 90 95 

Ala Thr His Gly Glu Pro Ser Pro Val Asn Ser His Pro Gin Arg Ser 
100 105 110 ' 

Asp Lys Asn Asn Glu Phe He Val He His Asn Gly He He Thr Asn 
115 120 125 

Tyr Lys Asp Leu Lys Lys Phe Leu Glu Ser Lys Gly Tyr Asp Phe Glu 
130 135 

Ser Glu Thr Asp Thr Glu Thr He Ala Lys Leu Val Lys Tyr Met Tyr 

150 155 160 

Asp Asn Arg Glu Ser Gin Asp Thr Ser Phe Thr Thr Leu Val Glu Arg 
165 170 175 



He Gin Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys Ser Val 
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180 185 190 

His Phe Pro Gly Gin Ala Val Gly Thr Arg Arg Gly Ser Pro Leu Leu 
195 200 205 

lie Gly Val Arg Ser Glu His Lys Leu Ser Thr Asp His lie Pro lie 
210 215 220 

Leu Tyr Arg Thr Ala Arg Thr Gin lie Gly Ser Lys Phe Thr Arg Trp' 
225 230 235 240 

Gly Ser Gin Gly Glu Arg Gly Lys Asp Lys Lys Gly Ser Cys Asn Leu 
245 250 255 

Ser Arg Val Asp Ser Thr Thr Cys Leu Phe Pro Val Glu Glu Lys Ala 
260 265 270 

Val Glu Tyr Tyr Phe Ala Ser Asp Ala Ser Ala Val lie Glu His Thr 
275 280 285 

Asn Arg Val He Phe Leu Glu Asp Asp Asp Val Ala Ala Val Val Asp 
290 295 300 

Gly Arg Leu Ser He His- Arg He Lys Arg Thr Ala Gly His His His 

310 315 320 

His His His Asp His Pro Gly Arg Ala Val Gin Thr Leu Gin Met Glu 
325 330 335 

Leu Gin Gin He Met Lys Gly Asn Phe Ser Ser Phe Met Gin Lys Glu 
340 345 350 

He Phe Glu Gin Pro Glu Ser Val Val Asn Thr Met Arg Gly Arg Val 
355 360 365 

Asn Phe Asp Asp Tyr Thr Val Asn Leu Gly Gly Leu Lys Asp His He 
370 375 380 

Lys Glu He Gin Arg Cys Arg Arg Leu He Leu He Ala Cys Gly Thr 
385 390 395 4qq 

Ser Tyr His Ala Gly Val Ala Thr Arg Gin Val Leu Glu Glu Leu Thr 
405 410 415 

Glu Leu Pro Val Met Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Asn 
420 425 430 

Thr Pro Val Phe Arg Asp Asp Val Cys Phe Phe Leu Ser Gin Ser Gly 
435 440 445 
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Glu Thr Ala Asp Thr Leu Met Gly Leu Arg Tyr Cys Lys Glu Arg Glv 
450 455 460 

Ala Leu Thr Val Gly lie Thr Asn Thr Val Gly Ser Ser lie Ser Arq 
465 470 475 480 

Glu Thr Asp Cys Gly Val His He Asn Ala Gly Pro Glu He Gly Val 
485 490 495 

Ala Ser Thr Lys Ala Tyr Thr Ser Gin Phe Val Ser Leu Val Met Phe 
500 505 510 

Ala Leu Met Met Cys Asp Asp Arg He Ser Met Gin Glu Arg Arg Lys 
515 520 525 

Glu He Met Leu Gly Leu Lys Arg Leu Pro Asp Leu He Lys Glu Val 
530 535 540 

Leu Ser Met Asp Asp Glu He Gin Lys Leu Ala Thr Glu Leu Tyr His 
545 550 555 560 

Gin Lys Ser Val Leu He Met Gly Arg Gly Tyr His Tyr Ala Thr Cys 
565 570 575 

Leu Glu Gly Ala Leu Lys He Lys Glu He Thr Tyr Met His Ser Glu 
580 585 590 

Gly He Leu Ala Gly Glu Leu Lys His Gly Pro Leu Ala Leu Val Asp 
595 600 605 

Lys Leu Met Pro Val He Met He He Met Arg Asp His Thr Tyr Ala 
610 615 620 

i 

Lys Cys Gin Asn Ala Leu Gin Gin Val Val Ala Arg Gin Gly Arg Pro 
^25 630 635 640 

Val Val He Cys Asp Lys Glu Asp Thr Glu Thr He Lys Asn Thr Lys 
645 650 655 

Arg Thr He Lys Val Pro His Ser Val Asp Cys Leu Gin Gly He Leu 
660 665 670 

Ser Val He Pro Leu Gin Leu Leu Ala Phe His Leu Ala Val Leu Arg 
675 680 685 



Gly Tyr Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val 
690 695 700 
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Glu 
705 



<210> 13 

<211> 608 

<212> PRT 

<213> Escherichia coli 



<400> 13 

Cys Gly lie Val Gly Ala lie Ala Gin Arg Asp Val Ala Glu He Leu 
15 10 15 

Leu Glu Gly Leu Arg Arg Leu Glu Tyr Arg Gly Tyr Asp Ser Ala Gly 
20 25 30 

Leu Ala Val Val Asp Ala Glu Gly His Met Thr Arg Leu Arg Arg Leu 
35 40 45 

Gly Lys Val Gin Met Leu Ala Gin Ala Ala Glu Glu His Pro Leu His 
50 55 60 

Gly Gly Thr Gly He Ala His Thr Arg Trp Ala Thr His Gly Glu Pro 
65 70 75 80 

Ser Glu Val Asn Ala His Pro His Val Ser Glu His He Val Val Val , 
85 90 95 

His Asn Gly He He Glu Asn His Glu Pro Leu Arg Glu Glu Leu Lys 
100 105 110 

Ala Arg Gly Tyr Thr Phe Val Ser Glu Thr Asp Thr Glu Val He Ala 
115 120 125 

His Leu Val Asn Trp Glu Leu Lys Gin Gly Gly Thr Leu Arg Glu Ala 
130 135 140 ^ 

Val Leu Arg Ala He Pro Gin Leu Arg Gly Ala Tyr Gly Thr Val He 
145 150 155 160 

Met Asp Ser Arg His Pro Asp Thr Leu Leu Ala Ala Arg Ser Gly Ser 
165 170 175 

Pro Leu Val He Gly Leu Gly Met Gly Glu Asn Phe He Ala Ser Asp 
180 185 190 

Gin Leu Ala Leu Leu Pro Val Thr Arg Arg Phe He Phe Leu Glu Glu 
195 200 205 



Gly Asp He Ala Glu He Thr Arg Arg Ser Val Asn He Phe Asp Lys 
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210 215 220 

Thr Gly Ala Glu Val Lys Arg Gin Asp He Glu Ser Asn Leu Gin Tvr 
225 230 235 240 

Asp Ala Gly Asp Lys Gly He Tyr Arg His Tyr Met Gin Lys Glu He 
245 250 255 

Tyr Glu Gin Pro Asn Ala He Lys Asn Thr Leu Thr Gly Arg He Ser 
260 265 270 

His Gly Gin Val Asp Leu Ser Glu Leu Gly Pro Asn Ala Asp Glu Leu 
275 280 285 

Leu Ser Lys Val Glu His He Gin He Leu Ala Cys Gly Thr Ser Tvr 
290 295 300 

Asn Ser Gly Met Val Ser Arg Tyr Trp Phe Glu Ser Leu Ala Gly He 

310 315 320 

Pro Cys Asp Val Glu He Ala Ser Glu Phe Arg Tyr Arg Lys Ser Ala 
325 330 335 

Val Arg Arg Asn Ser Leu Met He Thr Leu Ser Gin Ser Gly Glu Thr 
340 345 350 

Ala Asp Thr Leu Ala Gly Leu Arg Leu Ser Lys Glu Leu Gly Tyr Leu 
355 360 365 

Gly Ser Leu Ala He Cys Asn Val Pro Gly Ser Ser Leu Val Arg Glu 
370 375 380 

Ser Asp Leu Ala Leu Met Thr Asn Ala Gly Thr Glu He Gly Val Ala 

390 395 ^^400 

Ser Thr Lys Ala Phe Thr Thr Gin Leu Thr Val Leu Leu Met Leu Val 
405 410 415 

Ala Lys Leu Ser Arg Leu Lys Gly Leu Asp Ala Ser He Glu His Asp 
420 425 430 

He Val His Gly Leu Gin Ala Leu Pro Ser Arg He Glu Gin Met Leu 
435 440 445 

Ser Gin Asp Lys Arg He Glu Ala Leu Ala Glu Asp Phe Ser Asp Lys 
450 455 460 

His .His Ala Leu Phe Leu Gly Arg Gly Asp Gin Tyr Pro He Ala Leu 
465 470 475 480 
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Glu Gly Ala Leu Lys Leu Lys Glu lie Ser Tyr lie His Ala Glu Ala 
485 490 495 

Tyr Ala Ala Gly Glu Leu Lys His Gly Pro Leu Ala Leu lie Asp Ala 
500 505 510 

Asp Met Pro Val lie Val Val Ala Pro Asn Asn Glu Leu Leu Glu Lys 
515 520 525 

Leu Lys Ser Asn He Glu Glu Val Arg Ala Arg Gly Gly Gin Leu Tyr 
530 535 540 

Val Phe Ala Asp Gin Asp Ala Gly Phe Val Ser Ser Asp Asn Met His 
545 550 555 560 

He He Glu Met Pro His Val Glu Glu Val He Ala Pro He Phe Tyr 
565 570 575 

Thr Val Pro Leu Gin Leu Leu Ala Tyr His Val Ala Leu He Lys Gly 
580 585 590 

Thr Asp Val Asp Gin Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 
595 600 605 

<210> 14 
<211> 72 
<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Amorce 
<400> 14 

tggacgtctt tctatccatc gaattaaacg aactgcagga catcaccatc accatcacga 60 
tcaccccgga eg 72 

<210> 15 

<211> 44 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Amorce 

<400> 15 

caaagttgac tcttcctctc attgtgttca cgacagactc tggc 44 

<210> 16 

<211> 43 

<212> ADN 

<213> Sequence artificielle 
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<220> 

<223> Amorce 

<400> 16 

aatctagatt catgctcgag cggccgccag tgtgattgat ate 43 



<210> 17 

<211> 36 

<212> ADN 

<213> Sequence artificielle 

<220> 

<223> Amorce 

<400> 17 

atttttatca gagcgctggg ggtggctatt gacagg 

<210> 18 

<2ll> 8 

<212> PRT 

<213> Sequence artificielle 
<220> 

<223> Etiquette FIAG 

<400> 18 

Asp Thr Lys Asp Asp Asp Asp Lys 
1 5 



<210> 


19 


<211> 


6 


<212> 


PRT 


<213> 


Sequence artificielle 


<220> 




<223> 


Etiquette hexa-histidine 


<400> 


19 



His His His His His His 
1 5 
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